论坛首页 Java企业应用论坛

tomcat架构分析(容器类)

浏览 4191 次
精华帖 (1) :: 良好帖 (1) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2012-05-17   最后修改:2012-05-21

Tomcat提供了engine,host,context及wrapper四种容器。在总体结构中已经阐述了他们之间的包含关系。这四种容器继承了一个容器基类,因此可以定制化。当然,tomcat也提供了标准实现。

  • Engine:org.apache.catalina.core.StandardEngine
  • Host: org.apache.catalina.core.StandardHost
  • Context:org.apache.catalina.core.StandardContext
  • Wrapper:org.apache.catalina.core.StandardWrapper


所谓容器,就是说它承载了若干逻辑单元及运行时数据。好比,整个酒店是一个容器,它包含了各个楼层等设施;每个楼层也是容器,它包含了各个房间;每个房间也是容器,它包含了各种家电等等。
首先来看一下容器类的类结构。

基类ContainerBase
ContainerBase是个abstract基类。其类路径为:

org.apache.catalina.core.ContainerBase


这里只列出一些比较核心功能的组件及方法。需要注意的是,类中的方法及属性很多,限于篇幅不全部列出来了。
Enigne
Engine是最顶层的容器,它是host容器的组合。其标准实现类为:

org.apache.catalina.core.StandardEngine


看一下StandardEngine的主要逻辑单元概念图。

从图中可以看出,engine有四大组件:

  • Cluster: 实现tomcat集群,例如session共享等功能,通过配置server.xml可以实现,对其包含的所有host里的应用有效,该模块是可选的。其实现方式是基于pipeline+valve模式的,有时间会专门整理一个pipeline+valve模式应用系列;
  • Realm:实现用户权限管理模块,例如用户登录,访问控制等,通过通过配置server.xml可以实现,对其包含的所有host里的应用有效,该模块是可选的;
  • Pipeline:这里简单介绍下,之后会有专门文档说明。每个容器对象都有一个pipeline,它不是通过server.xml配置产生的,是必须有的。它就是容器对象实现逻辑操作的骨架,在pipeline上配置不同的valve,当需要调用此容器实现逻辑时,就会按照顺序将此pipeline上的所有valve调用一遍,这里可以参考责任链模式;
  • Valve:实现具体业务逻辑单元。可以定制化valve(实现特定接口),然后配置在server.xml里。对其包含的所有host里的应用有效。定制化的valve是可选的,但是每个容器有一个缺省的valve,例如engine的StandardEngineValve,是在StandardEngine里自带的,它主要实现了对其子host对象的StandardHostValve的调用,以此类推。


配置的例子有:

<Engine name="Catalina" defaultHost="localhost">   
  <Valve className="MyValve0"/>   
  <Valve className="MyValve1"/>   
  <Valve className="MyValve2"/>   
  ……   
  <Host name="localhost" appBase="webapps"> 
  </Host>
</Engine>


需要注意的是,运行环境中,pipeline上的valve数组按照配置的顺序加载,但是无论有无配置定制化的valve或有多少定制化的valve,每个容器缺省的valve,例如engine的StandardEngineValve,都会在数组中最后一个。
Host
Host是engine的子容器,它是context容器的集合。其标准实现类为:

org.apache.catalina.core.StandardHost


StandardHost的核心模块与StandardEngine差不多。只是作用域不一样,它的模块只对其包含的子context有效。除此,还有一些特殊的逻辑,例如context的部署。Context的部署还是比较多的,主要分为:

  • War部署
  • 文件夹部署
  • 配置部署等


有时间单独再说吧。照例贴个核心模块概念图。

Context
Context是host的子容器,它是wrapper容器的集合。其标准实现类为:

org.apache.catalina.core.StandardContext


应该说StandardContext是tomcat中最大的一个类。它封装的是每个web app。
看一下StandardContext的主要逻辑单元概念图。

Pipeline,valve,realm与上面容器一样,只是作用域不一样,不多说了。

  • Manager: 它主要是应用的session管理模块。其主要功能是session的创建,session的维护,session的持久化(persistence),以及跨context的session的管理等。Manager模块可以定制化,tomcat也给出了一个标准实现;
org.apache.catalina.session.StandardManager


manager模块是必须要有的,可以在server.xml中配置,如果没有配置的话,会在程序里生成一个manager对象。

  • Resources: 它是每个web app对应的部署结构的封装,比如,有的app是tomcat的webapps目录下的某个子目录或是在context节点配置的其他目录,或者是war文件部署的结构等。它对于每个web app是必须的。
  • Loader:它是对每个web app的自有的classloader的封装。具体内容涉及到tomcat的classloader体系,会在一篇文档中单独说明。Tomcat正是有一套完整的classloader体系,才能保证每个web app或是独立运营,或是共享某些对象等等。它对于每个web app是必须的。
  • Mapper:它封装了请求资源URI与每个相对应的处理wrapper容器的映射关系。


以某个web app的自有的web.xml配置为例;

<servlet>
  <servlet-name>httpserver</servlet-name>
  <servlet-class>com.gearever.servlet.TestServlet</servlet-class>
</servlet>
 
<servlet-mapping>
  <servlet-name>httpserver</servlet-name>
  <url-pattern>/*.do</url-pattern>
</servlet-mapping>


对于mapper对象,可以抽象的理解成一个map结构,其key是某个访问资源,例如/*.do,那么其value就是封装了处理这个资源TestServlet的某个wrapper对象。当访问/*.do资源时,TestServlet就会在mapper对象中定位到。这里需要特别说明的是,通过这个mapper对象定位特定的wrapper对象的方式,只有一种情况,那就是在servlet或jsp中通过forward方式访问资源时用到。例如,

request.getRequestDispatcher(url).forward(request, response)


关于mapper机制会在一篇文档中专门说明,这里简单介绍一下,方便理解。如图所示。

Mapper对象在tomcat中存在于两个地方(注意,不是说只有两个mapper对象存在),其一,是每个context容器对象中,它只记录了此context内部的访问资源与相对应的wrapper子容器的映射;其二,是connector模块中,这是tomcat全局的变量,它记录了一个完整的映射对应关系,即根据访问的完整URL如何定位到哪个host下的哪个context的哪个wrapper容器。
这样,通过上面说的forward方式访问资源会用到第一种mapper,除此之外,其他的任何方式,都是通过第二种方式的mapper定位到wrapper来处理的。也就是说,forward是服务器内部的重定向,不需要经过网络接口,因此只需要通过内存中的处理就能完成。这也就是常说的forward与sendRedirect方式重定向区别的根本所在。
看一下request.getRequestDispatcher(url) 方法的源码。

public RequestDispatcher getRequestDispatcher(String path) { 

  // Validate the path argument 
  if (path == null) 
    return (null); 
  if (!path.startsWith("/")) 
    throw new IllegalArgumentException 
     (sm.getString 
        ("applicationContext.requestDispatcher.iae", path)); 

  // Get query string 
  String queryString = null; 
  int pos = path.indexOf('?'); 
  if (pos >= 0) { 
    queryString = path.substring(pos + 1); 
    path = path.substring(0, pos); 
  } 

  path = normalize(path); 
  if (path == null) 
    return (null); 

  pos = path.length(); 

  // Use the thread local URI and mapping data 
  DispatchData dd = dispatchData.get(); 
  if (dd == null) { 
    dd = new DispatchData(); 
    dispatchData.set(dd); 
  } 

  MessageBytes uriMB = dd.uriMB; 
  uriMB.recycle(); 

  // Use the thread local mapping data 
  MappingData mappingData = dd.mappingData; 

  // Map the URI 
  CharChunk uriCC = uriMB.getCharChunk(); 
  try { 
    uriCC.append(context.getPath(), 0, context.getPath().length()); 
  /* 
  * Ignore any trailing path params (separated by ';') for mapping 
  * purposes 
  */ 
    int semicolon = path.indexOf(';'); 
      if (pos >= 0 && semicolon > pos) { 
      semicolon = -1; 
    } 
    uriCC.append(path, 0, semicolon > 0 ? semicolon : pos); 
    context.getMapper().map(uriMB, mappingData); 
    if (mappingData.wrapper == null) { 
      return (null); 
    } 
    /* 
    * Append any trailing path params (separated by ';') that were 
    * ignored for mapping purposes, so that they're reflected in the 
    * RequestDispatcher's requestURI 
    */ 
    if (semicolon > 0) { 
      uriCC.append(path, semicolon, pos - semicolon); 
    } 
  } catch (Exception e) { 
   // Should never happen 
   log(sm.getString("applicationContext.mapping.error"), e); 
   return (null); 
  } 

  Wrapper wrapper = (Wrapper) mappingData.wrapper; 
  String wrapperPath = mappingData.wrapperPath.toString(); 
  String pathInfo = mappingData.pathInfo.toString(); 

  mappingData.recycle(); 

  // Construct a RequestDispatcher to process this request 
  return new ApplicationDispatcher 
      (wrapper, uriCC.toString(), wrapperPath, pathInfo, 
          queryString, null); 

}


红色部分标记了从context的mapper对象中定位wrapper子容器,然后封装在一个dispatcher对象内并返回。通过上面的阐述,也说明了为什么forward方法不能跨context访问资源了。

Wrapper
Wrapper是context的子容器,它封装的处理资源的每个具体的servlet。其标准实现类为:

org.apache.catalina.core.StandardWrapper


应该说StandardWrapper是tomcat中比较重要的一个类。初认识它时,比较容易混淆。
先看一下StandardWrapper的主要逻辑单元概念图。

Pipeline,valve与上面容器一样,只是作用域不一样,不多说了。
主要说说servlet对象与servlet stack对象。这两个对象在wrapper容器中只存在其中之一,也就是说只有其中一个不为空。当以servlet对象存在时,说明此servlet是支持多线程并发访问的,也就是说不存在线程同步的过程,此wrapper容器中只包含一个servlet对象(这是我们常用的模式);当以servlet stack对象存在时,说明servlet是不支持多线程并发访问的,每个servlet对象任一时刻只有一个线程可以调用,这样servlet stack实现的就是个简易的线程池,此wrapper容器中只包含一组servlet对象,它的基本原型是worker thread模式实现的。
那么,怎么来决定是以servlet对象方式存储还是servlet stack方式存储呢?其实,只要在开发servlet类时,实现一个SingleThreadModel接口即可。
如果需要线程同步的servlet类,例如:

public class LoginServlet extends HttpServlet implements javax.servlet.SingleThreadModel{ …… }


但是值得注意的是,这种同步机制只是从servlet规范的角度来说提供的一种功能,在实际应用中并不能完全解决线程安全问题,例如如果servlet中有static数据访问等,因此如果对线程安全又比较严格要求的,最好还是用一些其他的自定义的解决方案。

Wrapper的基本功能已经说了。那么再说一个wrapper比较重要的概念。严格的说,并不是每一个访问资源对应一个wrapper对象。而是每一种访问资源对应一个wrapper对象。其大致可分为三种:

  • 处理静态资源的一个wrapper:例如html,jpg等静态资源的wrapper,它包含了一个tomcat的实现处理静态资源的缺省servlet:

 

org.apache.catalina.servlets.DefaultServlet

 

  • 处理jsp的一个wrapper:例如访问的所有jsp文件,它包含了一个tomcat的实现处理jsp的缺省servlet:

 

org.apache.jasper.servlet.JspServlet


它主要实现了对jsp的编译等操作

  • 处理servlet的若干wrapper:它包含了自定义的servlet对象,就是在web.xml中配置的servlet。


需要注意的是,前两种wrapper分别是一个,主要是其对应的是DefaultServlet及JspServlet。这两个servlet是在tomcat的全局conf目录下的web.xml中配置的,当app启动时,加载到内存中。

<servlet>
  <servlet-name>default</servlet-name>
  <servlet-class>org.apache.catalina.servlets.DefaultServlet</servlet-class>
  <init-param>
    <param-name>debug</param-name>
    <param-value>0</param-value>
  </init-param>
  <init-param>
    <param-name>listings</param-name>
    <param-value>false</param-value>
  </init-param>
  <load-on-startup>1</load-on-startup>
</servlet>
 
<servlet>
  <servlet-name>jsp</servlet-name>
  <servlet-class>org.apache.jasper.servlet.JspServlet</servlet-class>
  <init-param>
    <param-name>fork</param-name>
    <param-value>false</param-value>
  </init-param>
  <init-param>
    <param-name>xpoweredBy</param-name>
    <param-value>false</param-value>
  </init-param>
  <load-on-startup>3</load-on-startup>
</servlet>


至此,阐述了tomcat的四大容器结构。 有时间接着探讨tomcat如何将这四大容器串起来运作的。

 

 

http://gearever.iteye.com/

 

 

 

   发表时间:2012-05-18  
刚看到,发贴时代码中的红色部分怎么标啊
0 请登录后投票
   发表时间:2012-05-18  
期待楼主下文啊。。。
0 请登录后投票
   发表时间:2012-05-31  
写的很好,学习了。工作之余,写点自己见解,楼主加油
0 请登录后投票
   发表时间:2013-04-09  
gearever 写道
刚看到,发贴时代码中的红色部分怎么标啊

实在不行可以用贴图. 嘿嘿
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics