$TOC$
#### 叨叨几句
本来这个问题是在oschina上提出的:
<http://www.oschina.net/question/1179015_2140695>
但一直没收到合适的答案,所以还是自己下功夫梳理了一下,如果有错误的地方,欢迎交流。
通常的函数是通过ZEND_FUNCTION(xxx) 这种宏定义来实现的,这个规范很好理解,也很容易读懂源码。
但empty(), isset()的处理比较特殊,类似的还有echo, eval等。
#### 准备工作
用于查看PHP opcode的扩展vld,下载:
<http://pecl.php.net/package/vld>
PHP源码,分支 => remotes/origin/PHP-5.6.14
git clone http://git.php.net/repository/php-src.git -b PHP-5.6.14
PHP opcode对应参考:
<http://php.net/manual/en/internals2.opcodes.php>
> PHP执行程序版本为 5.6.14 ,其他版本opcode可能会有细微差别。
PHP 内核源码分析:
<http://www.php-internals.com/book/>
#### 开始分析
示例代码 vld.php :
<?php
$a = 0;
empty($a);
isset($a);
通过vld 查看opcode ,`php -d vld.active=1 vld.php`
number of ops: 10
compiled vars: !0 = $a
line #* E I O op fetch ext return operands
-------------------------------------------------------------------------------------
2 0 E > EXT_STMT
1 ASSIGN !0, 0
3 2 EXT_STMT
3 ISSET_ISEMPTY_VAR 293601280 ~1 !0
4 FREE ~1
4 5 EXT_STMT
6 ISSET_ISEMPTY_VAR 310378496 ~2 !0
7 FREE ~2
6 8 EXT_STMT
9 > RETURN 1
branch: # 0; line: 2- 6; sop: 0; eop: 9; out1: -2
opcode中都出现了ZEND_ISSET_ISEMPTY_VAR,我们一步步分析。
当执行PHP源码,会先进行语法分析,empty, isset的yacc如下:
vim Zend/zend_language_parser.y +1265
1265 internal_functions_in_yacc:
1266 › › T_ISSET '(' isset_variables ')' { $$ = $3; }
1267 › |› T_EMPTY '(' variable ')'› { zend_do_isset_or_isempty(ZEND_ISEMPTY, &$$, &$3 TSRMLS_CC); }
1275
1276 isset_variables:
1277 › › isset_variable› › › { $$ = $1; }
1280
1281 isset_variable:
1282 › › variable› › › › { zend_do_isset_or_isempty(ZEND_ISSET, &$$, &$1 TSRMLS_CC); }
最终都执行了zend_do_isset_or_isempty,继续查找:
git grep -in "zend_do_isset_or_isempty"
Zend/zend_compile.c:6287:void zend_do_isset_or_isempty(int type, znode *result, znode *variable TSRMLS_DC) /* {:{:{ */
vi Zend/zend_compile.c +6287
6287 void zend_do_isset_or_isempty(int type, znode *result, znode *variable TSRMLS_DC) /* {{{ */
6288 {
6289 › zend_op *last_op;
6290
6291 › zend_do_end_variable_parse(variable, BP_VAR_IS, 0 TSRMLS_CC);
6292
6293 › if (zend_is_function_or_method_call(variable)) {
6294 › › if (type == ZEND_ISEMPTY) {
6295 › › › /* empty(func()) can be transformed to !func() */
6296 › › › zend_do_unary_op(ZEND_BOOL_NOT, result, variable TSRMLS_CC);
6297 › › } else {
6298 › › › zend_error_noreturn(E_COMPILE_ERROR, "Cannot use isset() on the result of a function call (you can use \"null !== func()\" instead)");
6299 › › }
6300
6301 › › return;
6302 › }
6303
6304 › if (variable->op_type == IS_CV) {
6305 › › last_op = get_next_op(CG(active_op_array) TSRMLS_CC);
6306 › › last_op->opcode = ZEND_ISSET_ISEMPTY_VAR;
最后一行 6306,ZEND_ISSET_ISEMPTY_VAR 这个opcode 出来了,IS_CV 判断参数是否为变量。
注意zend_is_function_or_method_call(variable),当isset(fun($a)),函数参数写法会报错,empty在5.5版本开始支持函数参数,低版本不支持。
opcode 是由 zend_execute 执行的,最终会对应处理函数的查找,这个是核心,请参阅:
<http://www.php-internals.com/book/?p=chapt02/02-03-03-from-opcode-to-handler>
opcode 对应处理函数的命名规律:
ZEND_[opcode]_SPEC_(变量类型1)_(变量类型2)_HANDLER
变量类型1和变量类型2是可选的,如果同时存在,那就是左值和右值,归纳有下几类: VAR TMP CV UNUSED CONST 这样可以根据相关的执行场景来判定。
所以 ZEND_ISSET_ISEMPTY_VAR 对应的handler如下:
Zend/zend_vm_execute.h:44233: ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_CONST_HANDLER,
Zend/zend_vm_execute.h:44235: ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_VAR_HANDLER,
Zend/zend_vm_execute.h:44236: ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44238: ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_CONST_HANDLER,
Zend/zend_vm_execute.h:44240: ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_VAR_HANDLER,
Zend/zend_vm_execute.h:44241: ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44243: ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_CONST_HANDLER,
Zend/zend_vm_execute.h:44245: ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_VAR_HANDLER,
Zend/zend_vm_execute.h:44246: ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44253: ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_CONST_HANDLER,
Zend/zend_vm_execute.h:44255: ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER,
Zend/zend_vm_execute.h:44256: ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_UNUSED_HANDLER,
我们看下 ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER 这个处理函数:
vim Zend/zend_vm_execute.h +37946
38013 › if (opline->extended_value & ZEND_ISSET) {
38014 › › if (isset && Z_TYPE_PP(value) != IS_NULL) {
38015 › › › ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
38016 › › } else {
38017 › › › ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
38018 › › }
38019 › } else /* if (opline->extended_value & ZEND_ISEMPTY) */ {
38020 › › if (!isset || !i_zend_is_true(*value)) {
38021 › › › ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
38022 › › } else {
38023 › › › ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
38024 › › }
上面的 if ... else 就是判断是isset,还是empty,然后做不同处理,Z_TYPE_PP, i_zend_is_true 不同判断。
echo 等处理类似,自己按照流程具体去分析。关键是根据映射表找到对应的handler处理函数。
了解这些处理流程后,相信会对PHP语句的性能分析更熟悉。
转自:http://www.yinqisen.cn/blog-680.html
分享到:
相关推荐
Linux 4.4.0 内核源码分析 TCP ...Linux 4.4.0 内核源码中 TCP 实现是一个复杂的系统,它涉及到多个组件、函数和数据结构。理解 Linux 4.4.0 内核源码中 TCP 实现需要对 Linux 操作系统内核源码有深入的了解和理解。
sys_fork中首先会调用C函数find_empty_process产生一个新的进程,然后会调用C函数copy_process将父进程的内容复制给子进程,但是子进程tss中的eax值赋值为0(这也是为什么子进程中返回0的原因),当赋值完成后,copy...
本节将详细介绍Parasolid内核的函数、库和头文件,以及如何在UG(Unigraphics Solutions)环境中进行二次开发。 首先,Parasolid内核的函数库主要由一系列C语言接口组成,这些接口允许开发者调用内核的几何建模功能...
原子操作是 Linux 内核函数中的一种基本操作,用于实现多线程安全的数据访问。原子操作包括 atomic_read、atomic_set、atomic_add、atomic_sub、atomic_sub_and_test 等。这些操作可以确保在多线程环境中对数据的...
3. **关键函数实现**:分析如CreateProcess、ReadFile等函数的具体实现。 4. **调试技巧**:介绍如何使用调试工具(如Windbg)来分析内核问题。 #### 九、总结 《Windows内核原理与实现》不仅适合希望深入了解...
《Linux内核设计与实现(原书第3版)》是由Robert Love所著,陈莉君和康华翻译的一本全面指导Linux内核设计与实现的专业书籍。该书基于Linux 2.6.34内核,详细介绍了Linux内核系统的设计与实现。内容涵盖了进程管理...
动态替换Linux核心函数是一种高级调试和分析技术...总结来说,动态替换Linux核心函数是通过修改内核代码来改变其执行流程的一种技术,它在内核调试和分析中具有重要价值,但也需要谨慎操作,确保系统的稳定性和安全性。
在Linux内核中,还有很多其他的延时函数和方法,例如schedule_timeout、sleep_on_timeout等,这些函数都可以用于实现不同的延时需求。 在实际编程中,需要根据具体情况选择合适的延时函数和方法,以确保驱动程序的...
《Nt内核函数大全》是一份详尽的文档,主要涵盖了Windows操作系统中核心级别的Nt内核函数。这些函数是系统运行的基础,涉及到进程管理、线程控制、内存分配、设备驱动、文件操作等核心功能。对于系统开发者、驱动...
本篇将详细介绍Linux内核中用于内存操作的函数,包括内存的申请、释放、读写等接口。了解这些函数的使用对于深入理解Linux内核以及进行系统编程尤为重要。 1. kmalloc() / kfree():kmalloc()函数用于在内核空间...
由于内核环境中没有标准C库的支持,必须使用内核提供的特定函数来实现这一目标。以下是对主要涉及的函数的详细解释: 1. **打开文件**: 使用`filp_open()`函数来打开文件,它接受三个参数:`filename`(文件名,...
这些文件分别详细解读了Linux内核在处理文件系统交互、内存管理以及页缓存等方面的内部函数实现,对于开发者和系统管理员来说,深入理解这些函数可以帮助优化系统性能,解决复杂的问题,并进行内核级别的调试和定制...
《Nt内核函数大全》是一本专注于Windows操作系统内核函数的权威指南,它深入剖析了Windows NT内核中的各种函数,为系统开发者、驱动程序编写者以及安全研究人员提供了宝贵的参考资料。这本书详细介绍了Nt内核函数的...
在开发基于Linux内核的设备驱动程序时,熟练使用这些内核提供的函数是至关重要的。下面将详细介绍文档中提及的一些内核驱动常用函数的知识点。 首先,`copy_from_user`函数用于在用户空间和内核空间之间拷贝数据。...
这些策略由内核函数实现,如`schedule()`用于切换进程,`select()`和`poll()`用于等待I/O事件。 7. 锁机制:为了保证多线程环境下的数据一致性,内核使用了各种锁机制,如自旋锁(`spin_lock()`和`spin_unlock()`)...
02.PHP变量在内核中的实现.md 03.内存管理.md 04.配置编译环境.md 05.第一个扩展.md 06.函数的返回值.md 07.函数的参数.md 08.Array与HashTable.md 09.PHP中的资源类型.md 10.PHP中的面向对象上篇.md 11.PHP中的...
- **关键函数和数据结构**:研究重要的内核函数如何实现特定功能,以及相关的数据结构是如何定义和使用的。 - **性能优化**:探讨Windows内核如何通过各种技术提高系统的性能。 #### 五、总结 《Windows内核原理与...
在Windows内核中,函数是实现系统功能的基本单元。这些函数涵盖了进程管理、线程调度、内存管理、设备驱动、文件系统、网络协议栈等多个关键领域。通过对这些源码函数的理解,我们可以深入了解操作系统如何协调硬件...
### Linux Kernel 2.4-7 内核函数手册...以上总结了《Linux Kernel 2.4-7 内核函数手册》中的一些关键知识点,涉及驱动基础、数据类型、基本 C 库函数以及内存管理等方面,为深入学习 Linux 内核编程提供了坚实的基础。