作者:PHPchina
PHP作为Web开发的脚本语言,以其简单、效率高等特点深受广大程序员的青睐,但PHP在其运行过程中一些源代码的校验也是学习过程中不可忽视的一个小问题。
下面是一份对PHP5.1.4底层的研究,是一位从事PHP很长时间并有较深入研究的来自PHPChina.com上的PHPer。在此向他表示感谢!
PHP源代码分析(针对版本PHP5.1.4)
PHP源代码分析 1
1. 目录结构 1
2. PHP使用Lex和Yacc对语法进行解析。 1
3. PHP如何使用Mysql? 2
4. 安全模式? 2
5. 那些是 PHP 的标准函数,那些是扩展函数? 2
6. PHP 源代码中的PHP_FUNCTION(xx) 宏。 2
7. 那些函数集是标准的? 2
8. 一些函数的实现过程 2
9. PHP 函数集注册过程 3
10. 有趣的Zend LOGO图片 3
11. PHP的语法树? 3
12. 从 CVS 获取 PHP 源代码 5
1. 目录结构
1. build 和编译有关的目录。
2. ext 扩展库代码,例如 Mysql、zlib、iconv 等我们熟悉的扩展库。
3. main 主目录。
4. sapi 和各种服务器的接口调用,例如apache、IIS等,也包含一般的fastcgi、cgi等。
5. win32 和 Windows 下编译 PHP 有关的脚本。用了 WSH。
6. Zend 文件夹核心的引擎。
7. scripts Linux 下的脚本目录。
8. tests 测试脚本目录
9. sapi 各类 Web 服务器的接口。
2. PHP使用Lex和Yacc对语法进行解析。
在 Zend 目录下有两个文件 zend_language_parser.y 与 zend_language_scanner.l 他们是Lex和Yacc的脚本文件,通过这两个脚本文件生成对应的.c和.h文件,实际上这在 linux 下非常普遍,gcc 也使用它们产生语树。
3. PHP如何使用Mysql?
ext 目录下有一个 mysql 子目录,这个目录中的php_mysql.c 和 php_mysql.h 负责 PHP 与 Mysql 操作。使用了 Mysql 手册中的 C 语言 API。
4. 安全模式?
main 文件夹下的safe_mode.h 和 safe_mode.c 文件负责PHP的安全模式。
5. 那些是 PHP 的标准函数,那些是扩展函数?
ext 目录下英文意思是扩展,而在 ext 下还是有一个 standard 文件夹,存放着 PHP 中的标准函数,例如 explode 这个函数是在./ext/standard/string.c 下定义的。
6. PHP 源代码中的PHP_FUNCTION(xx) 宏。
这个宏用来检验一个函数名称是否合法。合法的函数名称应该由小写字母及下划线组成。
7. 那些函数集是标准的?
通过 ./ext/standard/ 目录我们可以看到以下常用函数集是标准的。字符串函数集、数组函数集、文件及目录操作函数集、md5算法等。
8. 一些函数的实现过程
1. fsockopen, pfsockopen 的实现
这两个函数的实现离不开 ./ext/standard/fsock.c 文件中的 php_fsockopen_stream 函数。具体的socket都在./main/network.c 中实
现。
9. PHP 函数集注册过程
在./main/internal_functions.c 中有一个数组 php_builtin_extensions 默认下有以下成员:
1. phpext_bcmath_ptr
2. phpext_calendar_ptr
3. phpext_com_dotnet_ptr
4. phpext_ctype_ptr
5. phpext_date_ptr
6. phpext_ftp_ptr
7. phpext_hash_ptr
8. phpext_odbc_ptr
9. phpext_pcre_ptr
10. phpext_reflection_ptr
11. phpext_session_ptr
12. phpext_spl_ptr
13. phpext_standard_ptr
14. phpext_tokenizer_ptr
15. phpext_zlib_ptr
接着 php_register_extensions(php_builtin_extensions, EXTCOUNT TSRMLS_CC) 进行注册
10. 有趣的Zend LOGO图片
./main/logos.h 文件中,用 zend_logo 与 php_logo 数组保存了 PHP 标志和 Zend 标志。所以你根本在发行包里找不到zend.gif。
【小知识:Zend 公司创建于 1999 年,之所以命名为 Zend,是取其公司两位始创者Zeev Suraski 和Andi Gutmans 姓名的近似合成发音(Zeev & Andi),Zend 作为 PHP 语言的缔造者和延续着在 PHP 社区中发挥着极为重要的作用,Zend公司一直具备PHP技术的设想和创新能力,并因此保持PHP独一无二的技术领先地位!】
11. PHP的语法树?
1. Lex与Yacc
市面上有这本书。大家可以买来看看,包括GCC都是用它们兄弟生成的语法树。如果对编译器感兴趣。可以翻阅市面上关于这方面的书,并不多就几本。
2. y语法树文件
./Zend/zend_language_scanner.l与./Zend/zend_language_parser.y 规定了PHP的语法。从字面意义上scanner表示语法初步扫描, parser表示语法解析。根据这两个文件lex与yacc可以生成对应的c代码。所以相对来说生成语法是很方便的。
3. 如何定义一个符号
例如 if($language='php') 这一句中的if 就是一个token 语法中我们用T_IF表示。具体在.l文件中如下定义了:
<ST_IN_SCRIPTING>"if" {
return T_IF;
}
这样.php文件中的if就会被翻译成内置符号T_IF。’(单引号)被如下定义:
<ST_SINGLE_QUOTE>['] {
BEGIN(ST_IN_SCRIPTING);
return '\'';
}
4. 复合符号例如最常见的变量命名$discuz_user, $submit 等。
<ST_IN_SCRIPTING,ST_DOUBLE_QUOTES,ST_HEREDOC,ST_BACKQUOTE>"$"{LABEL} {
zend_copy_value(zendlval, (yytext+1), (yyleng-1));
zendlval->type = IS_STRING;
return T_VARIABLE;
}
5. 一个有效的if语句过程
这个定义在zend_language_parser.y 189行:
T_IF '(' expr ')' {
zend_do_if_cond(&$3, &$4 TSRMLS_CC);
} statement {
zend_do_if_after_statement(&$4, 1 TSRMLS_CC);
} elseif_list else_single {
zend_do_if_end(TSRMLS_C);
}
T_IF '(' expr ')' ':' {
zend_do_if_cond(&$3, &$4 TSRMLS_CC);
} inner_statement_list {
zend_do_if_after_statement(&$4, 1 TSRMLS_CC);
} new_elseif_list new_else_single T_ENDIF ';' {
zend_do_if_end(TSRMLS_C);
}
if 后面必须存在(),圆括弧里面是表达式 expr 表达式在734行被定义:
expr:
r_variable { $$ = $1; }
expr_without_variable { $$ = $1; }
;
if 后面可以跟 elseif 语句及 else 语句。
从语法树里面我们看出 if () 后面是可以跟 : 的,这一般很少被使用吧。
6. 优先级和左右结合性
一般情况下.y文件中最先定义的操作符优先级相对低,并且可以使用%left、%right 进行描述左右结合性,例如:
%left '+' '-' '.'
%left '*' '/' '%'
%right '!'
这说明'!'在 PHP 语法中是右结合的, '*' '/' '%' '+' '-' '.' 是左结合的,并且'!'的优先级更高
例如语法 !$a + $b 要先计算 !$a 在进行加法操作%left ',' 被放在最上面定义,说明他的优先级最低,因为我们知道','可以等同一个语句。
7. php.ini的解析
1. 如果规定数值正负?
<INITIAL>[ ]*("true" "on" "yes")[ ]* {
ini_lval->value.str.val = zend_strndup("1", 1);
ini_lval->value.str.len = 1;
ini_lval->type = IS_STRING;
return CFG_TRUE;
}
<INITIAL>[ ]*("false" "off" "no" "none")[ ]* {
ini_lval->value.str.val = zend_strndup("", 0);
ini_lval->value.str.len = 0;
ini_lval->type = IS_STRING;
return CFG_FALSE;
}
12. 从 CVS 获取 PHP 源代码
1. 安装 CVS 版本工具,例如 TortoiseCVS。
2. cvs -d :pserver:cvsread@cvs.php.net:/repository checkout php-src 具体的CVS使用办法请参考 CVS 手册及其它著作。
PHP.ini 文件的默认配置,定义在 ./main/main.c 342行
-- ./main/main.c -- 342:
/* {{{ PHP_INI
*/
PHP_INI_BEGIN()
PHP_INI_ENTRY_EX("define_syslog_variables", "0", PHP_INI_ALL, NULL,
php_ini_boolean_displayer_cb)
PHP_INI_ENTRY_EX("highlight.bg", HL_BG_COLOR, PHP_INI_ALL, NULL,
php_ini_color_displayer_cb)
PHP_INI_ENTRY_EX("highlight.comment", HL_COMMENT_COLOR, PHP_INI_ALL, NULL,
php_ini_color_displayer_cb)
PHP_INI_ENTRY_EX("highlight.default", HL_DEFAULT_COLOR, PHP_INI_ALL, NULL,
php_ini_color_displayer_cb)
PHP_INI_ENTRY_EX("highlight.html", HL_HTML_COLOR, PHP_INI_ALL, NULL,
php_ini_color_displayer_cb)
PHP_INI_ENTRY_EX("highlight.keyword", HL_KEYWORD_COLOR, PHP_INI_ALL, NULL,
php_ini_color_displayer_cb)
PHP_INI_ENTRY_EX("highlight.string", HL_STRING_COLOR, PHP_INI_ALL, NULL,
php_ini_color_displayer_cb)
more lines ... ...
PHP_INI_END()
/* }}} */
-- ./main/main.c --
在最新版本的PHP中 memory_limit 由原来的 8M 修改成了 16M
分享到:
相关推荐
《PHP 5.1.4:经典版本的深入解析》 PHP(PHP:Hypertext Preprocessor)是一种广泛使用的开源脚本语言,尤其在Web开发领域中占据着重要的地位。PHP 5.1.4是PHP发展历史上的一个重要版本,它在功能、性能和稳定性上...
描述中的“希望大家能有所帮助”暗示了这个压缩包可能是一个安装包或源代码包,供开发者或者系统管理员在Windows环境下搭建PHP运行环境或进行开发工作。 标签“php-5.1.4-Win32”与标题一致,进一步强调了这个...
免费的源代码统计分析工具,能够统计包括:代码行数、开发工数、项目成本、质量指标等项目信息,支持30多种源代码格式。具有统计迅速、准确的优点,是程序开发人员的必备工具。可以对 C++、VB.Net、VB、C#、JAVA、...
《Android系统源代码情景分析》随书光盘内容(源代码) 目录如下: 第1篇 初识Android系统 第1章 准备知识 1.1 Linux内核参考书籍 1.2 Android应用程序参考书籍 1.3 下载、编译和运行Android源代码 ...
VisualSVN-5.1.4
上篇 UNIX操作系统版本6源代码 UNIX操作系统过程分类索引 3 UNIX操作系统文件及过程 5 UNIX操作系统定义的符号列表 7 UNIX操作系统源代码交叉引用列表 9 第一部分 初始化、进程初始化 25 第二部分 陷入、中断、系统...
MinGW-5.1.4是该项目的一个特定版本,它包含了GCC 5.1.4和其他相关工具,允许开发者在Windows上编译C、C++、Fortran等语言的源代码,而无需安装完整的GNU工具链。 这个免安装版本的MinGW-5.1.4非常方便,用户只需将...
赠送源代码:aviator-5.1.4-sources.jar; 赠送Maven依赖信息文件:aviator-5.1.4.pom; 包含翻译后的API文档:aviator-5.1.4-javadoc-API文档-中文(简体)版.zip; Maven坐标:com.googlecode.aviator:aviator:5.1.4...
VisulSVN 5.1.4 破解文件 VisualSVN.Core.L.dll; 1.关闭vs; 2.将 VisualSVN.Core.L.dll 复制到安装目录 C:\Program Files (x86)\VisualSVN\bin 覆盖原文件; 3.启动vs,破解成功;
《Spring Framework 5.1.4源码深度解析》 Spring Framework是Java开发中的核心框架,它为构建高质量的企业级应用提供了全面的支持。5.1.4版本是Spring的重要里程碑,引入了诸多新特性和改进,旨在提升性能、增强可...
赠送源代码:aviator-5.1.4-sources.jar; 赠送Maven依赖信息文件:aviator-5.1.4.pom; 包含翻译后的API文档:aviator-5.1.4-javadoc-API文档-中文(简体)-英语-对照版.zip; Maven坐标:...
下载 PHP 5.3 的源代码,配置时指定 Apache 的模块模式(`--with-apxs2=/usr/sbin/apxs`),以及 GD、MySQL、libxml2 等扩展。完成配置后,执行 `make` 和 `make install`。将 PHP 模块添加到 Apache 的配置文件中,...
SciTE是一个源代码编辑器,支持多种编程语言,具有语法高亮、自动完成、错误检测等功能。对于Lua开发者而言,lua-SciTE提供了一个友好且功能强大的工作环境,能够提升开发效率。 在lua-SciTE中,你可以享受到以下...
破解VisualSVN5.1.4,生成的dll文件直接覆盖掉安装目录中的同名文件就可以了
《Android系统源代码情景分析》随书光盘内容(源代码) 目录如下: 第1篇 初识Android系统 第1章 准备知识 1.1 Linux内核参考书籍 1.2 Android应用程序参考书籍 1.3 下载、编译和运行Android源代码 1.3.1 下载...
在MinGW-5.1.4中,GCC负责将源代码转换为可执行的二进制文件。它包含了预处理器、编译器、汇编器和链接器等一系列编译过程中的关键组件。预处理器处理宏定义和条件编译指令;编译器将源代码转换为中间的汇编语言;...
MingW5.1.4是这个项目的一个版本,相较于早期的MingW2.95,它提供了更多的功能和改进,尤其是在处理某些特定的编译问题时,比如在本例中提到的“limists”可能是一个特定的库或者代码片段,MingW5.1.4能够成功编译而...
总的来说,"giflib5.1.4-lib-dll" 提供了一套完整的解决方案,帮助开发者在Windows系统上快速实现对GIF图像的处理和动画支持,而Linux用户则需要自行编译源代码以获得相应支持。对于那些需要处理大量GIF图像或开发...
**WinSCP_5.1.4_XiaZaiBa** WinSCP是一款强大的文件传输协议(FTP)客户端,尤其适用于SSH(Secure Shell)协议。这款软件以其直观的图形用户界面和丰富的功能深受IT专业人士喜爱。标题中的"WinSCP_5.1.4_XiaZaiBa...
很好用的svn插件,可以在visual studio里面便捷使用svn,程序员不可缺少的利器