`
wyk86485480
  • 浏览: 28647 次
  • 性别: Icon_minigender_1
  • 来自: 沈阳
文章分类
社区版块
存档分类
最新评论

PHP内核中是如何实现 empty, isset 这些函数的

PHP 
阅读更多

$TOC$

#### 叨叨几句

本来这个问题是在oschina上提出的: 
<http://www.oschina.net/question/1179015_2140695>

但一直没收到合适的答案,所以还是自己下功夫梳理了一下,如果有错误的地方,欢迎交流。

通常的函数是通过ZEND_FUNCTION(xxx) 这种宏定义来实现的,这个规范很好理解,也很容易读懂源码。

但empty(), isset()的处理比较特殊,类似的还有echo, eval等。

#### 准备工作

用于查看PHP opcode的扩展vld,下载: 
<http://pecl.php.net/package/vld>

PHP源码,分支 => remotes/origin/PHP-5.6.14

git clone http://git.php.net/repository/php-src.git -b PHP-5.6.14

PHP opcode对应参考: 
<http://php.net/manual/en/internals2.opcodes.php>

> PHP执行程序版本为 5.6.14 ,其他版本opcode可能会有细微差别。

PHP 内核源码分析: 
<http://www.php-internals.com/book/>

#### 开始分析

示例代码 vld.php :

<?php
$a = 0;
empty($a);
isset($a);

通过vld 查看opcode ,`php -d vld.active=1 vld.php`

number of ops:  10
compiled vars:  !0 = $a
line     #* E I O op                           fetch          ext  return  operands
-------------------------------------------------------------------------------------
   2     0  E >   EXT_STMT
1        ASSIGN                                                   !0, 0
   3     2        EXT_STMT
3        ISSET_ISEMPTY_VAR                           293601280  ~1      !0
4        FREE                                                     ~1
   4     5        EXT_STMT
6        ISSET_ISEMPTY_VAR                           310378496  ~2      !0
7        FREE                                                     ~2
   6     8        EXT_STMT
9      > RETURN                                                   1

branch: #  0; line:     2-    6; sop:     0; eop:     9; out1:  -2

opcode中都出现了ZEND_ISSET_ISEMPTY_VAR,我们一步步分析。

当执行PHP源码,会先进行语法分析,empty, isset的yacc如下:

vim Zend/zend_language_parser.y +1265

1265 internal_functions_in_yacc:
1266 ›   ›   T_ISSET '(' isset_variables ')' { $$ = $3; }
1267 ›   |›  T_EMPTY '(' variable ')'›   { zend_do_isset_or_isempty(ZEND_ISEMPTY, &$$, &$3 TSRMLS_CC); }
1275
1276 isset_variables:
1277 ›   ›   isset_variable› ›   ›   { $$ = $1; }
1280
1281 isset_variable:
1282 ›   ›   variable›   ›   ›   ›   { zend_do_isset_or_isempty(ZEND_ISSET, &$$, &$1 TSRMLS_CC); }

最终都执行了zend_do_isset_or_isempty,继续查找:

git grep -in "zend_do_isset_or_isempty"
Zend/zend_compile.c:6287:void zend_do_isset_or_isempty(int type, znode *result, znode *variable TSRMLS_DC) /* {:{:{ */

vi Zend/zend_compile.c +6287

6287 void zend_do_isset_or_isempty(int type, znode *result, znode *variable TSRMLS_DC) /* {{{ */
6288 {
6289 ›   zend_op *last_op;
6290
6291 ›   zend_do_end_variable_parse(variable, BP_VAR_IS, 0 TSRMLS_CC);
6292
6293 ›   if (zend_is_function_or_method_call(variable)) {
6294 ›   ›   if (type == ZEND_ISEMPTY) {
6295 ›   ›   ›   /* empty(func()) can be transformed to !func() */
6296 ›   ›   ›   zend_do_unary_op(ZEND_BOOL_NOT, result, variable TSRMLS_CC);
6297 ›   ›   } else {
6298 ›   ›   ›   zend_error_noreturn(E_COMPILE_ERROR, "Cannot use isset() on the result of a function call (you can use \"null !== func()\" instead)");
6299 ›   ›   }
6300
6301 ›   ›   return;
6302 ›   }
6303
6304 ›   if (variable->op_type == IS_CV) {
6305 ›   ›   last_op = get_next_op(CG(active_op_array) TSRMLS_CC);
6306 ›   ›   last_op->opcode = ZEND_ISSET_ISEMPTY_VAR;

最后一行 6306,ZEND_ISSET_ISEMPTY_VAR 这个opcode 出来了,IS_CV 判断参数是否为变量。
注意zend_is_function_or_method_call(variable),当isset(fun($a)),函数参数写法会报错,empty在5.5版本开始支持函数参数,低版本不支持。

opcode 是由 zend_execute 执行的,最终会对应处理函数的查找,这个是核心,请参阅: 
<http://www.php-internals.com/book/?p=chapt02/02-03-03-from-opcode-to-handler>

opcode 对应处理函数的命名规律:

ZEND_[opcode]_SPEC_(变量类型1)_(变量类型2)_HANDLER

变量类型1和变量类型2是可选的,如果同时存在,那就是左值和右值,归纳有下几类: VAR TMP CV UNUSED CONST 这样可以根据相关的执行场景来判定。

所以 ZEND_ISSET_ISEMPTY_VAR 对应的handler如下:

Zend/zend_vm_execute.h:44233:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_CONST_HANDLER,
Zend/zend_vm_execute.h:44235:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_VAR_HANDLER,
Zend/zend_vm_execute.h:44236:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44238:   ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_CONST_HANDLER,
Zend/zend_vm_execute.h:44240:   ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_VAR_HANDLER,
Zend/zend_vm_execute.h:44241:   ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44243:   ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_CONST_HANDLER,
Zend/zend_vm_execute.h:44245:   ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_VAR_HANDLER,
Zend/zend_vm_execute.h:44246:   ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44253:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_CONST_HANDLER,
Zend/zend_vm_execute.h:44255:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER,
Zend/zend_vm_execute.h:44256:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_UNUSED_HANDLER,

我们看下 ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER 这个处理函数:
vim Zend/zend_vm_execute.h +37946

38013 ›   if (opline->extended_value & ZEND_ISSET) {
38014 ›   ›   if (isset && Z_TYPE_PP(value) != IS_NULL) {
38015 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
38016 ›   ›   } else {
38017 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
38018 ›   ›   }
38019 ›   } else /* if (opline->extended_value & ZEND_ISEMPTY) */ {
38020 ›   ›   if (!isset || !i_zend_is_true(*value)) {
38021 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
38022 ›   ›   } else {
38023 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
38024 ›   ›   }

上面的 if ... else 就是判断是isset,还是empty,然后做不同处理,Z_TYPE_PP, i_zend_is_true 不同判断。
echo 等处理类似,自己按照流程具体去分析。关键是根据映射表找到对应的handler处理函数。

了解这些处理流程后,相信会对PHP语句的性能分析更熟悉。

转自:http://www.yinqisen.cn/blog-680.html
分享到:
评论

相关推荐

    Linux 4.4.0内核源码分析TCP实现

    Linux 4.4.0 内核源码分析 TCP ...Linux 4.4.0 内核源码中 TCP 实现是一个复杂的系统,它涉及到多个组件、函数和数据结构。理解 Linux 4.4.0 内核源码中 TCP 实现需要对 Linux 操作系统内核源码有深入的了解和理解。

    Linux内核设计与实现.pdf

    sys_fork中首先会调用C函数find_empty_process产生一个新的进程,然后会调用C函数copy_process将父进程的内容复制给子进程,但是子进程tss中的eax值赋值为0(这也是为什么子进程中返回0的原因),当赋值完成后,copy...

    parasolid内核函数(库和头文件)

    本节将详细介绍Parasolid内核的函数、库和头文件,以及如何在UG(Unigraphics Solutions)环境中进行二次开发。 首先,Parasolid内核的函数库主要由一系列C语言接口组成,这些接口允许开发者调用内核的几何建模功能...

    linux内核函数文档.pdf

    原子操作是 Linux 内核函数中的一种基本操作,用于实现多线程安全的数据访问。原子操作包括 atomic_read、atomic_set、atomic_add、atomic_sub、atomic_sub_and_test 等。这些操作可以确保在多线程环境中对数据的...

    Windows内核原理与实现.PDF

    3. **关键函数实现**:分析如CreateProcess、ReadFile等函数的具体实现。 4. **调试技巧**:介绍如何使用调试工具(如Windbg)来分析内核问题。 #### 九、总结 《Windows内核原理与实现》不仅适合希望深入了解...

    动态替换Linux核心函数的原理和实现

    动态替换Linux核心函数是一种高级调试和分析技术...总结来说,动态替换Linux核心函数是通过修改内核代码来改变其执行流程的一种技术,它在内核调试和分析中具有重要价值,但也需要谨慎操作,确保系统的稳定性和安全性。

    Linux内核延时研究与函数代码分析

    在Linux内核中,还有很多其他的延时函数和方法,例如schedule_timeout、sleep_on_timeout等,这些函数都可以用于实现不同的延时需求。 在实际编程中,需要根据具体情况选择合适的延时函数和方法,以确保驱动程序的...

    linux内核内存操作篇之内存操作相关函数

    本篇将详细介绍Linux内核中用于内存操作的函数,包括内存的申请、释放、读写等接口。了解这些函数的使用对于深入理解Linux内核以及进行系统编程尤为重要。 1. kmalloc() / kfree():kmalloc()函数用于在内核空间...

    Linux内核中读写文件数据的方法

    由于内核环境中没有标准C库的支持,必须使用内核提供的特定函数来实现这一目标。以下是对主要涉及的函数的详细解释: 1. **打开文件**: 使用`filp_open()`函数来打开文件,它接受三个参数:`filename`(文件名,...

    Linux内核函数详解

    这些文件分别详细解读了Linux内核在处理文件系统交互、内存管理以及页缓存等方面的内部函数实现,对于开发者和系统管理员来说,深入理解这些函数可以帮助优化系统性能,解决复杂的问题,并进行内核级别的调试和定制...

    Nt内核函数大全.RAR

    《Nt内核函数大全》是一本专注于Windows操作系统内核函数的权威指南,它深入剖析了Windows NT内核中的各种函数,为系统开发者、驱动程序编写者以及安全研究人员提供了宝贵的参考资料。这本书详细介绍了Nt内核函数的...

    linux2.6.38内核驱动常用函数.pdf

    在开发基于Linux内核的设备驱动程序时,熟练使用这些内核提供的函数是至关重要的。下面将详细介绍文档中提及的一些内核驱动常用函数的知识点。 首先,`copy_from_user`函数用于在用户空间和内核空间之间拷贝数据。...

    Nt内核函数大全

    《Nt内核函数大全》是一份详尽的文档,主要涵盖了Windows操作系统中核心级别的Nt内核函数。这些函数是系统运行的基础,涉及到进程管理、线程控制、内存分配、设备驱动、文件操作等核心功能。对于系统开发者、驱动...

    内核相关文档linux内核函数

    这些策略由内核函数实现,如`schedule()`用于切换进程,`select()`和`poll()`用于等待I/O事件。 7. 锁机制:为了保证多线程环境下的数据一致性,内核使用了各种锁机制,如自旋锁(`spin_lock()`和`spin_unlock()`)...

    PHP学习笔记:包含PHP的生命周期,PHP变量在内核中的实现等内容

    02.PHP变量在内核中的实现.md 03.内存管理.md 04.配置编译环境.md 05.第一个扩展.md 06.函数的返回值.md 07.函数的参数.md 08.Array与HashTable.md 09.PHP中的资源类型.md 10.PHP中的面向对象上篇.md 11.PHP中的...

    Windows内核原理与实现

    - **关键函数和数据结构**:研究重要的内核函数如何实现特定功能,以及相关的数据结构是如何定义和使用的。 - **性能优化**:探讨Windows内核如何通过各种技术提高系统的性能。 #### 五、总结 《Windows内核原理与...

    windows内核源码函数文档

    在Windows内核中,函数是实现系统功能的基本单元。这些函数涵盖了进程管理、线程调度、内存管理、设备驱动、文件系统、网络协议栈等多个关键领域。通过对这些源码函数的理解,我们可以深入了解操作系统如何协调硬件...

    linux kernel 2.4-7 内核函数手册

    ### Linux Kernel 2.4-7 内核函数手册...以上总结了《Linux Kernel 2.4-7 内核函数手册》中的一些关键知识点,涉及驱动基础、数据类型、基本 C 库函数以及内存管理等方面,为深入学习 Linux 内核编程提供了坚实的基础。

    深入理解PHP内核-php宝典

    函数实现 - **函数调用栈**:每当PHP执行一个函数调用时,都会创建一个新的栈帧来保存函数的局部变量和参数。这有助于理解和优化函数调用的性能。 - **参数传递方式**:PHP支持按值传递和按引用传递两种方式。按...

Global site tag (gtag.js) - Google Analytics