DSO是Dynamic Shared Objects(动态共享目标)的缩写,它是现代Unix派生出来的操作系统都存在着的一种动态连接机制。它提供了一种在运行时将特殊格式的代码,在程序运行需要时,将需要的部分从外存调入内存执行的方法。Apache在1.3以后的版本后开始支持它。因为Apache早就使用一个模块概念来扩展它的功能并且在内部使用一个基于调度的列表来链接扩展模块到Apache核心模块.所以,Apache早就注定要使用DSO来在运行时加载它的模块。
让我们先来看一下Apache本身的程序结构:这是一个很复杂的四层结构--每一层构建在下一层之上。
第四层是用Apache模块开发的第三方库--比如open ssl一般来说在Apache的官方发行版中这层是空的,但是在实际的Apache结构中这些库构成的层结构肯定是存在的。
第三层是一些可选的附加功能模块--如mod_ssl,mod_perl。这一层的每个模块通常实现的是Apache的一个独立的分离的功能而事实上这些模块没有一个是必须的,运行一个最小的Apache不需要任何一个此层的模块。
第二层是Apache的基本功能库-这也是Apache的核心本质层--这层包括Apache内核,http_core(Apache的核心模块),它们实现了基本HTTP功能(比如资源处理(通过文件描述符和内存段等等),保持预生成(pre-forked)子进程模型,监听已配置的虚拟服务器的TCP/IP套接字,传输HTTP请求流到处理进程,处理HTTP协议状态,读写缓冲,此外还有附加的许多功能比如URL和MIME头的解析及DSO的装载等),也提供了Apache的应用程序接口(API)(其实Apache的真正功能还是包含在内部模块中的,为了允许这些模块完全控制Apache进程,内核必须提供API接口),这层也包括了一般性的可用代码库(libap)和实现正则表达式匹配的库(libregex)还有就是一个小的操作系统的抽象库(libos)。
最低层是与OS相关的平台性应用函数,这些OS可以是不同现代UNIX的变种,win32,os/2,MacOS甚至只要是一个POSIX子系统。
图1 apache模块功能分层
在这个复杂的程序结构中有趣的部分是---事实上第三层和第四层与第二层之间是松散的连接,而另一方面第三层的模块间是互相依赖的--因这种结构造成的显著影响就是第三层和第四层的代码不能静态地连接到最低层平台级的代码上。因此DSO模式就成了解决它的一种手段。结合DSO功能,这个结构就变得很灵活了,可以让Apache内核(从技术上说应该是mod_so模块而不是内核)在启动时(而不是安装时)装载必要的部分以实现第三层和第四层的功能。
现代类Unix的系统都有一种叫动态共享对象(DSO)的动态连接/加载的巧妙的机制,从而可以在运行时刻,将编译成特殊格式的代码加载到一个可执行程序的地址空间。
加载的方法通常有两种:其一是,在可执行文件启动时由系统程序ld.so自动加载;其二是,在执行程序中手工地通过Unix加载器的系统接口执行系统调用dlopen()/dlsym()以实现加载。
按第一种方法,DSO通常被称为共享库(shared libraries)或者DSO库(DSO libraries),使用libfoo.so或者libfoo.so.1.2的文件名,被存储在系统目录中(通常是/usr/lib),并在编译安装时,使用连接器参数-lfoo建立了指向可执行程序的连接。通过设置连接器参数-R或者环境变量LD_LIBRARY_PATH,库中硬编码了可执行文件的路径,使Unix加载器能够定位到位于/usr/lib的libfoo.so,以解析可执行文件中尚未解析的位于DSO的符号。
通常,DSO不会引用可执行文件中的符号(因为它是通用代码的可重用库),也不会有后继的解析动作。可执行文件无须自己作任何动作以使用DSO中的符号,而完全由Unix加载器代办(事实上,调用ld.so
的代码是被连入每个可执行文件的非静态运行时刻启动代码的一部分)。动态加载公共库代码的优点是明显的:只需要在系统库libc.so
中存储一个库代码,从而为每个程序节省了磁盘存储空间。
按第二种方法,DSO通常被称为共享对象(shared objects)或者DSO文件(DSO files),可以使用任何文件名(但是规范的名称是foo.so
),被存储在程序特定的目录中,也不会自动建立指向其所用的可执行文件的连接,而由可执行文件在运行时自己调用dlopen()
来加载DSO到其地址空间,同时也不会进行为可执行文件解析DSO中符号的操作。Unix加载器会根据可执行程序的输出符号表和已经加载的DSO库自动解析DSO中尚未解析的符号(尤其是无所不在的libc.so
中的符号),如此DSO就获得了可执行程序的符号信息,就好象是被静态连接的。
最后,为了利用DSO API的优点,执行程序必须用dlsym()
解析DSO中的符号,以备稍后在诸如指派表等中使用。也就是说,执行程序必须自己解析其所需的符号。这种机制的优点是允许不加载可选的程序部件,直到程序需要的时候才被动态地加载(也就不需要内存开销),以扩展程序的功能。
虽然这种DSO机制看似很直接,但至少有一个难点,就是在用DSO扩展程序功能(即第二种方法)时为DSO对可执行程序中符号的解析,这是因为,“反向解析”可执行程序中的DSO符号在所有标准平台上与库的设计都是矛盾的(库不会知道什么程序会使用它)。实际应用中,可执行文件中的全局符号通常不是重输出的,因此不能为DSO所用。所以在运行时刻用DSO来扩展程序功能,就必须找到强制连接器输出所有全局符号的方法。
共享库是一种典型的解决方法,因为它符合DSO机制,而且为操作系统所提供的几乎所有类型的库所使用。另一方面,使用共享对象并不是许多程序为扩展其功能所采用的方法。
截止到1998年,只有少数软件包使用DSO机制在运行时刻实际地扩展其功能,诸如Perl 5(通过其XS机制和DynaLoader模块), Netscape Server等。从1.3版本开始,Apache也加入此列,因为Apache已经用了基于指派表(dispatch-list-based)的方法来连接外部模块到Apache的核心。所以,Apache也就当然地在运行时刻用DSO来加载其模块。
优点和缺点
上述基于DSO的功能有如下优点:
- 由于服务器包的装配工作可以在运行时刻使用httpd.conf的配置命令LoadModule来进行,而不是在编译中使用configure来进行,因此显得更灵活。比如:只需要安装一个Apache,就可以运行多个不同的服务器实例(如标准&SSL版本,浓缩的&功能加强版本[mod_perl, PHP3],等等)。
- 服务器包可以在安装后使用第三方模块被轻易地扩展。这至少对厂商发行包的维护者有巨大的好处,他可以建立一个Apache核心包,而为诸如PHP3, mod_perl, mod_fastcgi等扩展另建附加的包。
- 更简单的Apache模块原型。使用DSO配合apxs,可以脱离Apache源代码树,仅需要一个apxs -i和一个apachectl restart命令,把开发的模块新版本纳入运行中的Apache服务器。
DSO有如下缺点:
- 由于并不是所有的操作系统都支持动态加载代码到一个程序的地址空间,因此DSO机制并不能用于所有的平台。
- 由于Unix加载器有必须进行的符号解析的开销,服务器的启动会慢20%左右。
- 在某些平台上,独立位置代码(positon independent code[PIC])有时需要复杂的汇编语言技巧来实现相对寻址,而绝对寻址则不需要,因此服务器在运行时会慢5%左右。
- 由于DSO模块不能在所有平台上为其他基于DSO的库所连接(ld -lfoo),比如,基于a.out的平台通常不提供此功能,而基于ELF的平台则提供,因此DSO机制并不能被用于所有类型的模块。或者可以这样说,编译为DSO文件的模块只能使用由Apache核心、C库(libc)和Apache核心所用的所有其他动态或静态的库、含有独立位置代码的静态库(libfoo.a)所提供的符号。而要使用其他代码,就只能确保Apache核心本身包含对此代码的引用,或者自己用dlopen()来加载此代码。
模块实现
Apache对独立模块的DSO支持是建立在被静态编译进Apache核心的mod_so模块基础上的,这是core以外唯一不能作为DSO存在的模块,而其他所有已发布的Apache模块,都可以通过安装文档中阐述的配置选项--enable-module=shared,被独立地编译成DSO并使之生效。一个被编译为mod_foo.so的DSO模块,可以在httpd.conf中使用mod_so的LoadModule指令,在服务器启动或重新启动时被加载。
用命令行参数-l可以查看已经编译到服务器中的模块。
新提供的支持程序apxs(APache eXtenSion)可以在Apache源代码树以外编译基于DSO的模块,从而简化Apache DSO模块的建立过程。其原理很简单:安装Apache时,配置命令make install会安装Apache C头文件,并把依赖于平台的编译器和连接器参数传给apxs程序,使用户可以脱离Apache的发布源代码树编译其模块源代码,而不改变支持DSO的编译器和连接器的参数。
用法概要
Apache 2.0的DSO功能简要说明:
- 编译并安装已发布的Apache模块,比如编译mod_foo.c为mod_foo.so的DSO模块:
$ ./configure --prefix=/path/to/install --enable-foo=shared
$ make install
- 编译并安装第三方Apache模块, 比如编译mod_foo.c为mod_foo.so的DSO模块:
$ ./configure --add-module=module_type:/path/to/3rdparty/mod_foo.c --enable-foo=shared
$ make install
- 配置Apache以便共享后续安装的模块:
$ ./configure --enable-so
$ make install
- 用apxs在Apache源代码树以外编译并安装第三方Apache模块,比如编译mod_foo.c为mod_foo.so的DSO模块:
$ cd /path/to/3rdparty
$ apxs -c mod_foo.c
$ apxs -i -a -n foo mod_foo.la
共享模块编译完毕以后,都必须在httpd.conf中用LoadModule指令使Apache激活该模块。
参考资料:
Ralf S. Engelschall-- Apache 1.3 Dynamic Shared Object (DSO) Support
Apache2.0 文档-- 动态共享对象
分享到:
相关推荐
**DSO(Dynamic Shared Object)开发详解** DSO,全称Dynamic Shared Object,是Linux操作系统中的动态...通过阅读"dso说明.doc"并实践"webdemo",可以深入理解DSO的工作原理,并掌握如何在实际项目中应用DSO技术。
7. **多处理模块(MPMs)**:文档解释了Apache中多种MPMs的工作原理及其配置方法。 8. **环境变量**:探讨了Apache服务器如何使用环境变量来影响其操作。 9. **处理器使用**:涉及Apache处理器的使用细节。 10. *...
Apache 服务器是互联网上最广泛使用的网页...总之,Apache服务器的配置是一项涉及多方面知识的任务,包括操作系统交互、网络服务原理、服务器性能优化等,熟练掌握这些技能对于管理和维护高效稳定的Web服务至关重要。
Apache 2.0 过滤器工作原理 Apache 2.0 中的Hook函数 Apache 2.0 开发者文档 将模块从Apache1.3转化到Apache2.0 Apache 2.0 对请求的处理 Apache 2.0 线程安全问题 经常问到的问题 认证、授权、访问控制 CGI动态页面...
- **DSO (Dynamic Shared Object):** 动态共享对象机制允许Apache在运行时动态加载和卸载模块,增强了Apache的灵活性。 - **MPM (Multipath Processing Modules):** 多路处理模块提供了不同的并发处理模型,包括...
### Apache 2.2.0 官方文档关键知识点概览 #### 一、文档概述与版权信息 - **文档版本**: Apache HTTP Server 文档版本为2.2。 - **版权所有**: 版权归Apache Software Foundation所有,发布日期为2005年12月2日。 ...
- **2.17 过滤器**:讲解 Apache HTTP Server 中过滤器的工作原理和使用方法。 - **2.18 suEXEC 支持**:介绍如何使用 suEXEC 机制来运行 CGI 脚本以提高安全性。 - **2.19 Apache 性能调优**:给出一系列优化 ...
本书将引导读者了解Apache的内部工作原理,并逐步学习如何利用这些知识构建模块。 **Apache模块开发的基础** 1. **Apache架构**:首先,你需要了解Apache的模块化结构,包括主服务器、子进程、配置文件解析以及...
- **工作原理**: 基于客户端请求的 Host 头来确定使用哪个虚拟主机。 - **配置示例**: 提供了具体的配置示例代码。 **3. 基于 IP 的虚拟主机支持** - **IP 分配**: 为每个虚拟主机分配独立的 IP 地址。 - **配置...
Apache服务器处理PHP的生命周期可以通过mod_dso模块来加载动态共享对象,这是Apache的一个模块,允许动态加载和卸载模块。mod_php5.c则是PHP5.x版本中Apache模块的源码文件,它注册了处理器,使得Apache能够将PHP...
3. **高性能**:Apache提供了预生成模式、动态共享对象(DSO)等功能,以提升响应速度和运行效率。 4. **广泛支持**:Apache支持HTTP 1.1协议,具备基于文件的简单配置,支持虚拟主机、HTTP认证、SSL加密、CGI脚本、...
雅虎的Apache模块培训PPT可能涵盖了如何开发和使用这些模块,特别是关于Apache模块的内部工作原理和配置。 Apache模块是Apache服务器的核心组件,它们负责处理HTTP请求的不同方面,如请求处理、URL解析、权限检查、...
最初的想法是拦截 Apache 和 PHP 之间的交互,例如在 Apache 模块 `mod_php4.c` 中的 `send_php()` 函数中操作文件指针。这种方法可以通过创建临时文件,解密源码后再将其替换,从而实现加密。然而,这种方法有两个...
### Apache的apxs和dso的关系 - **apxs**:Apache的扩展编译工具,用于安装和卸载模块。 - **DSO**:Dynamic Shared Object,动态共享对象,一种动态加载模块的技术,使Apache能够加载额外的功能模块而无需重新编译...