`
luliangok
  • 浏览: 816336 次
文章分类
社区版块
存档分类
最新评论

深入理解PHP原理之变量分离/引用(Variables Separation)

 
阅读更多

在前面的文章中我已经介绍了PHP的变量的内部表示(深入理解PHP原理之变量(Variables inside PHP)),以及PHP中作用域的实现机制(深入理解PHP原理之变量作用域(Scope inside PHP))。这节我们就接着前面的文章,继续介绍PHP中变量分离和引用的概念:

首先我们回顾一下zval的结构:

其中的refcount和is_ref字段我们一直都没有介绍过,我们知道PHP是一个长时间运行的服务器端的脚本解释器。那么对于它来说,效率和资源占用率是一个很重要的衡量标准,也就是说,PHP必须尽量介绍内存占用率,考虑下面这段代码:

第一行代码创建了一个字符串变量,申请了一个大小为9字节的内存,保存了字符串”laruence”和一个NULL(\0)的结尾。
第二行定义了一个新的字符串变量,并将变量var的值”复制”给这个新的变量。
第三行unset了变量var

这样的代码在我们平时的脚本中是很常见的,如果PHP对于每一个变量赋值都重新分配内存,copy数据的话,那么上面的这段代码公要申请18个字节的内存空间,而我们也很容易的看出来,上面的代码其实根本没有必要申请俩份空间,呵呵,PHP的开发者也看出来了:

我们之前讲过,PHP中的变量是用一个存储在symbol_table中的符号名,对应一个zval来实现的,比如对于上面的第一行代码,会在symbol_table中存储一个值”var”, 对应的有一个指针指向一个zval结构,变量值”laruence”保存在这个zval中,所以不难想象,对于上面的代码来说,我们完全可以让”var”和”var_dup”对应的指针都指向同一个zval就可以了。

PHP也是这样做的,这个时候就需要介绍我们之前一直没有介绍过的zval结构中的refcount字段了。
refcount,顾名思义,记录了当前的zval被引用的计数。
比如对于代码:

第一行,创建了一个整形变量,变量值是1。 此时保存整形1的这个zval的refcount为1。
第二行,创建了一个新的整形变量,变量也指向刚才创建的zval,并将这个zval的refcount加1,此时这个zval的refcount为2。
PHP提供了一个函数可以帮助我们了解这个过程debug_zval_dump:

输出:

如果你奇怪 ,var的refcount应该是1啊?
我们知道,对于简单变量,PHP是以传值的形式穿参数的。也就是说,当执行debug_zval_dump($var)的时候,$var会以传值的方式传递给debug_zval_dump,也就是会导致var的refcount加1,所以我们只要能看到,当变量赋值给一个变量以后,能导致zval的refcount加1这个事实即可。

现在我们回头看文章开头的代码, 当执行了最后一行unset($var)以后,会发生什么呢? 对,既是refcount减1,上代码:

输出:

但是,对于下面的代码呢?

很明显在这段代码执行以后,$var_dup的值应该还是”laruence”, 那么这又是怎么实现的呢?
这就是PHP的copy on write机制:
PHP在修改一个变量以前,会首先查看这个变量的refcount,如果refcount大于1,PHP就会执行一个分离的例程, 对于上面的代码,当执行到第三行的时候,PHP发现$var指向的zval的refcount大于1,那么PHP就会复制一个新的zval出来,将原zval的refcount减1,并修改symbol_table,使得$var和$var_dup分离(Separation)。这个机制就是所谓的copy on write(写时复制)。

上代码测试:

输出:

现在我们知道,当使用变量复制的时候 ,PHP内部并不是真正的复制,而是采用指向相同的结构来尽量节约开销。那么,对于PHP中的引用,那又是如何实现呢?

这段代码结束以后,$var也会被间接的修改为1,这个过程称作(change on write:写时改变)。那么ZE是怎么知道,这次的复制是不需要Separation的呢?
这个时候就要用到zval中的is_ref字段了:
对于上面的代码,当第二行执行以后,$var所代表的zval的refcount变为2,并且同时置is_ref为1。
到第三行的时候,PHP先检查var_ref代表的zval的is_ref字段,如果为1,则不分离,大体逻辑示意如下:

但是,问题又来了,对于如下的代码,又会怎样呢?

对于上面的代码,存在一对copy on write的变量$var和$var_dup, 又有一对change on write机制的变量对$var和$var_ref,这个情况又是如何运作的呢?

当第二行执行的时候,和前面讲过的一样,$var_dup 和 $var 指向相同的zval, refcount为2.
当执行第三行的时候,PHP发现要操作的zval的refcount大于1,则,PHP会执行Separation, 将$var_dup分离出去,并将$var和$var_ref做change on write关联。也就是,refcount=2, is_ref=1;

基于这样的分析,我们就可以让debug_zval_dump出refcount为1的结果来:

输出:

详细原因,读者你只要稍加分析就能得出,我就不越俎代庖了。;)

这次我们介绍了PHP的变量分离机制,下次我会继续介绍如果在扩展中接收和传出PHP脚本中的参数。另外,因为最近变动比较大(换工作),所以抱歉这么长时间才有更新。


分享到:
评论

相关推荐

    浅析PHP原理之变量分离/引用(Variables Separation)

    本文将深入探讨PHP中的变量分离(Variables Separation)和引用(References)的概念,以及它们如何影响内存使用和程序执行效率。 首先,我们需要理解PHP中的zval结构。zval是PHP内部用于存储变量值的数据结构,...

    西门子变量的导出/导入有哪些方法可供选择?.pdf

     WinCC 变量可以使用 Smart Tools “Variables Import/Export” (VarExim.exe) 软件工具和 “Configuration Tool” 软件工具进行导出和导入。这些软件工具作为标准 随 WinCC 一起提供。必须通过 WinCC 安装程序进行...

    浅析PHP原理之变量(Variables inside PHP)

    本文将深入探讨PHP变量的原理,尤其是如何在PHP的底层实现弱类型。 首先,PHP的弱类型特性意味着在声明变量时,我们无需指定变量的数据类型。例如: ```php $var = 1; // int $var = "laruence"; // string $var =...

    设置环境变量工具 NVM - eNvironment Variables Manager

    设置Windows环境变量工具 NVM - eNvironment Variables Manager 1.可以设置用户变量、系统变量,非常方便。 2.可以把环境变量导出成XML文件,不过不能导入 类似的工具有EnvMan,RapidEE。 此工具的源代码可以在...

    JBPM深入解析之变量设计

    **JBPM深入解析之变量设计** JBPM(Java Business Process Management)是一款开源的工作流程管理系统,它提供了业务流程的建模、部署、执行和监控等功能。在JBPM中,变量是流程实例中的数据容器,用于存储流程运行...

    。System_Variables_en系统变量.pdf

    总的来说,《System Variables》是KUKA机器人系统用户的重要工具,它提供了对系统变量全面而深入的理解,帮助用户充分利用KUKA机器人系统的潜力,实现高效和精确的自动化任务。无论是在系统设定、故障排查还是性能...

    C/C++ 跨文件共享全局变量Demo

    - **依赖性**:过度依赖全局变量会使代码难以理解和维护,因为它们可以无处不在地被修改。 - **线程安全**:在多线程环境中,全局变量的访问需要特别注意同步,否则可能会引发竞态条件。 - **模块化**:全局变量不...

    KUKA机器人系统变量手册.rar

    《KUKA机器人系统变量手册》是一份详细阐述KUKA机器人系统变量的参考资料,它为用户提供了深入理解并有效操控KUKA机器人的关键信息。这份手册的重要性在于,它帮助程序员、工程师以及技术人员能够更好地掌握和应用...

    变量Variables)1

    在本文中,我们将深入探讨变量的声明、作用以及自由变量和约束变量的区别。 首先,声明一个变量涉及到指定变量的类型和名称。例如,在Java中,`int i`声明了一个名为`i`的整型变量。变量名必须遵循一定的命名规则,...

    rf-实现变量文件的几种方式.rar

    - **环境变量**: 通过系统环境变量引用,如 `${ENV::VARNAME}`。 - **资源变量**: 通过`*** Variables ***`部分定义在测试数据文件中的变量。 - **导入变量文件**: 通过`Import Variables`关键字导入外部文件的...

    KUKA系统变量英文版Google翻译过后的中文文档(KSS 8.1, 8.2, 8.3)

    《KUKA系统变量中文版(KSS 8.1, 8.2, 8.3)》是针对KUKA工业机器人系统的用户和开发者的一份重要参考资料,旨在帮助他们理解和利用KSS(KUKA System Software)的8.1、8.2和8.3版本中的系统变量。这份文档不仅提供...

    中介变量内生中介变量内生

    综上所述,解决中介变量内生性问题需要深入理解统计学原理,结合合适的分析方法,并可能需要借助如"ivmediate_Becker_Woessmann_2009_example.do"这样的实际案例来学习和实践。在进行数据分析时,确保正确处理内生性...

    编译原理PL/0源程序

    3. Variables:定义了编译器中使用的变量,例如fa、fa1、fa2、listswitch、ch、sym、id、num、cc、ll、kk、cx等。 4. Procedures:定义了编译器中使用的过程,例如error过程等。 四、编译原理PL/0源程序实现细节 1...

    labview局部变量与全局变量

    本压缩包包含有关LabVIEW局部变量和全局变量的重要知识资源,非常适合想要深入理解和掌握这两种变量用法的学习者。 **局部变量(Local Variables)** 在LabVIEW中,局部变量是在函数或子VI内部定义的,它们的作用...

    oracle biee变量总结

    请求变量是用于在前端定义新的会话变量的方法之一,它允许用户在运行时重新定义变量的值。 **创建方法**: - 在前端创建一个请求变量,并指定其绑定的会话变量。 - 用户可以通过界面操作来修改请求变量的值,从而间接...

    迭代的保留有信息变量

    迭代的保留有信息变量(Iterative Retained Informativeness Variables,简称IRIV)是一种在多元校正分析中用于...对这个文件的深入理解和使用,可以帮助我们更好地掌握IRIV方法,并将其应用于实际的数据分析任务中。

    静态全局变量,静态局部变量,全局变量,局部变量

    ### C/C++中静态全局变量、静态局部变量、全局变量及局部变量的深入解析 #### 一、概念区分 在C/C++编程语言中,**静态全局变量**、**静态局部变量**、**全局变量**及**局部变量**是经常使用的几种变量类型,它们...

Global site tag (gtag.js) - Google Analytics