有幸参与2015年的PHP技术峰会(PHPCON),听了鸟哥(惠新宸)的关于PHP7的 新特性和性能优化的分享,一切都令人感 到激动。鸟哥是国内最权威的PHP专家,他的分享有很多非常有价值的东西,我通过整理分享的PPT和收集相关资料,整理为这篇解读性质的技术文章,希望能 给做PHP开发的同学一些帮助。
PHP已经走过了20年的历史,直到今天,PHP7都发布了RC版,据说,PHP7正式版应该会在2015年11月份左右发布。PHP7对于上一个系列的PHP5.*,可以说是一个大规模的革新,尤其是在性能方面实现跨越式的大幅提升。
PHP是一种在全球范围内被广泛使用的Web开发语言,PHP7的革新也当然会给这些Web服务带来更深刻的变化。这里引用鸟哥PPT中的一个图表(82%的Web站点有使用PHP作为开发语言):
(注:一个web站点可以会使用多种语言作为它的开发语言)
(注:本文含有不少从鸟哥PPT里的截图,图片版权归鸟哥所有)
我们先看看两张激动人心的性能测试结果图:
Benchmark对比(图片来自于PPT):
PHP7的性能测试结果,性能压测结果,耗时从2.991下降到1.186,大幅度下降60%。
WordPress的QPS压测(图片来自于PPT):
而在WordPress项目中,PHP7对比PHP5.6,QPS提升2.77倍。
看完令人激动的性能测试结果对比,我们就进入正题哈。PHP7的新增特性很多,不过,我们会更聚焦于那些主要的变化。
一、新增特性和改变
1. 标量类型和返回类型声明(Scalar Type Declarations & Scalar Type Declarations)
PHP 语言一个非常重要的特点就是“弱类型”,它让PHP的程序变得非常容易编写,新手接触PHP能够快速上手,不过,它也伴随着一些争议。支持变 量类型的定义,可以说是革新性质的变化,PHP开始以可选的方式支持类型定义。除此之外,还引入了一个开关指令 declare(strict_type=1);,当这个指令一旦开启,将会强制当前文件下的程序遵循严格的函数传参类型和返回类型。
例如一个add函数加上类型定义,可以写成这样:
如果配合强制类型开关指令,则可以变为这样:
如果不开启strict_type,PHP将会尝试帮你转换成要求的类型,而开启之后,会改变PHP就不再做类型转换,类型不匹配就会抛出错误。对于喜欢“强类型”语言的同学来说,这是一大福音。
更为详细的介绍:PHP7标量类型声明RFC[翻译]
2. 更多的Error变为可捕获的Exception
PHP7 实现了一个全局的throwable接口,原来的Exception和部分Error都实现了这个接口(interface), 以接口的 方式定义了异常的继承结构。于是,PHP7中更多的Error变为可捕获的Exception返回给开发者,如果不进行捕获则为Error,如果捕获就变 为一个可在程序内处理的Exception。这些可被捕获的Error通常都是不会对程序造成致命伤害的Error,例如函数不存。PHP7进一步方便开 发者处理,让开发者对程序的掌控能力更强。因为在默认情况下,Error会直接导致程序中断,而PHP7则提供捕获并且处理的能力,让程序继续执行下去, 为程序员提供更灵活的选择。
例如,执行一个我们不确定是否存在的函数,PHP5兼容的做法是在函数被调用之前追加的判断function_exist,而PHP7则支持捕获Exception的处理方式。
如下图中的例子(截图来源于PPT内):
3. AST(Abstract Syntax Tree,抽象语法树)
AST在PHP编译过程作为一个中间件的角色,替换原来直接从解释器吐出opcode的方式,让解释器(parser)和编译器(compliler)解耦,可以减少一些Hack代码,同时,让实现更容易理解和可维护。
PHP5:
PHP7:
更多AST信息:https://wiki.php.net/rfc/abstract_syntax_tree
4. Native TLS(Native Thread local storage,原生线程本地存储)
PHP 在多线程模式下(例如,Web服务器Apache的woker和event模式,就是多线程),需要解决“线程安全” (TS,Thread Safe)的问题,因为线程是共享进程的内存空间的,所以每个线程本身需要通过某种方式,构建私有的空间来保存自己的私有数据,避 免和其他线程相互污染。而PHP5采用的方式,就是维护一个全局大数组,为每一个线程分配一份独立的存储空间,线程通过各自拥有的key值来访问这个全局 数据组。
而这个独有的key值在PHP5中需要传递给每一个需要用到全局变量的函数,PHP7认为这种传递的方式并不友好,并且存在一些问题。因而,尝试采用一个全局的线程特定变量来保存这个key值。
相关的Native TLS问题:https://wiki.php.net/rfc/native-tls
5. 其他新特性
PHP7新特性和变化不少,我们这里并不全部展开来细说哈。
- Int64支持,统一不同平台下的整型长度,字符串和文件上传都支持大于2GB。
- 统一变量语法(Uniform variable syntax)。
- foreach表现行为一致(Consistently foreach behaviors)
- 新的操作符 <=>, ??
- Unicode字符格式支持(\u{xxxxx})
- 匿名类支持(Anonymous Class)
… …
二、跨越式的性能突破:全速前进
1. JIT与性能
Just In Time(即时编译)是一种软件优化技术,指在运行时才会去编译字节码为机器码。从直觉出发,我们都很容易认为,机器码是计算机能 够直接识别和执行的,比起Zend读取opcode逐条执行效率会更高。其中,HHVM(HipHop Virtual Machine,HHVM是一个 Facebook开源的PHP虚拟机)就采用JIT,让他们的PHP性能测试提升了一个数量级,放出一个令人震惊的测试结果,也让我们直观地认为JIT是 一项点石成金的强大技术。
而实际上,在2013年的时候,鸟哥和Dmitry(PHP语言内核开发者之一)就曾经在PHP5.5的版本上 做过一个JIT的尝试(并没有发 布)。PHP5.5的原来的执行流程,是将PHP代码通过词法和语法分析,编译成opcode字节码(格式和汇编有点像),然后,Zend引擎读取这些 opcode指令,逐条解析执行。
而他们在opcode环节后引入了类型推断(TypeInf),然后通过JIT生成ByteCodes,然后再执行。
于是,在benchmark(测试程序)中得到令人兴奋的结果,实现JIT后性能比PHP5.5提升了8倍。然而,当他们把这个优化放入到实际的项目WordPress(一个开源博客项目)中,却几乎看不见性能的提升,得到了一个令人费解的测试结果。
于是,他们使用Linux下的profile类型工具,对程序执行进行CPU耗时占用分析。
执行100次WordPress的CPU消耗的分布(截图来自PPT):
注解:
- 21%CPU时间花费在内存管理。
- 12%CPU时间花费在hash table操作,主要是PHP数组的增删改查。
- 30%CPU时间花费在内置函数,例如strlen。
- 25%CPU时间花费在VM(Zend引擎)。
经过分析之后,得到了两个结论:
(1)JIT生成的ByteCodes如果太大,会引起CPU缓存命中率下降(CPU Cache Miss)
在 PHP5.5的代码里,因为并没有明显类型定义,只能靠类型推断。尽可能将可以推断出来的变量类型,定义出来,然后,结合类型推断,将非该类型的 分支代码去掉,生成直接可执行的机器码。然而,类型推断不能推断出全部类型,在WordPress中,能够推断出来的类型信息只有不到30%,能够减少的 分支代码有限。导致JIT以后,直接生成机器码,生成的ByteCodes太大,最终引起CPU缓存命中大幅度下降(CPU Cache Miss)。
CPU 缓存命中是指,CPU在读取并执行指令的过程中,如果需要的数据在CPU一级缓存(L1)中读取不到,就不得不往下继续寻找,一直到二级缓存 (L2)和三级缓存(L3),最终会尝试到内存区域里寻找所需要的指令数据,而内存和CPU缓存之间的读取耗时差距可以达到100倍级别。所 以,ByteCodes如果过大,执行指令数量过多,导致多级缓存无法容纳如此之多的数据,部分指令将不得不被存放到内存区域。
CPU的各级缓存的大小也是有限的,下图是Intel i7 920的配置信息:
因此,CPU缓存命中率下降会带来严重的耗时增加,另一方面,JIT带来的性能提升,也被它所抵消掉了。
通 过JIT,可以降低VM的开销,同时,通过指令优化,可以间接降低内存管理的开发,因为可以减少内存分配的次数。然而,对于真实的 WordPress项目来说,CPU耗时只有25%在VM上,主要的问题和瓶颈实际上并不在VM上。因此,JIT的优化计划,最后没有被列入该版本的 PHP7特性中。不过,它很可能会在更后面的版本中实现,这点也非常值得我们期待哈。
(2)JIT性能的提升效果取决于项目的实际瓶颈
JIT 在benchmark中有大幅度的提升,是因为代码量比较少,最终生成的ByteCodes也比较小,同时主要的开销是在VM中。而应用在 WordPress实际项目中并没有明显的性能提升,原因WordPress的代码量要比benchmark大得多,虽然JIT降低了VM的开销,但是因 为ByteCodes太大而又引起CPU缓存命中下降和额外的内存开销,最终变成没有提升。
不同类型的项目会有不同的CPU开销比例,也会得到不同的结果,脱离实际项目的性能测试,并不具有很好的代表性。
2. Zval的改变
PHP的各种类型的变量,其实,真正存储的载体就是Zval,它特点是海纳百川,有容乃大。从本质上看,它是C语言实现的一个结构体(struct)。对于写PHP的同学,可以将它粗略理解为是一个类似array数组的东西。
PHP5的Zval,内存占据24个字节(截图来自PPT):
PHP7的Zval,内存占据16个字节(截图来自PPT):
Zval 从24个字节下降到16个字节,为什么会下降呢,这里需要补一点点的C语言基础,辅助不熟悉C的同学理解。struct和union(联合 体)有点不同,Struct的每一个成员变量要各自占据一块独立的内存空间,而union里的成员变量是共用一块内存空间(也就是说修改其中一个成员变 量,公有空间就被修改了,其他成员变量的记录也就没有了)。因此,虽然成员变量看起来多了不少,但是实际占据的内存空间却下降了。
除此之外,还有被明显改变的特性,部分简单类型不再使用引用。
Zval结构图(来源于PPT中):
图 中Zval的由2个64bits(1字节=8bit,bit是“位”)组成,如果变量类型是long、bealoon这些长度不超过64bit 的,则直接存储到value中,就没有下面的引用了。当变量类型是array、objec、string等超过64bit的,value存储的就是一个指 针,指向真实的存储结构地址。
对于简单的变量类型来说,Zval的存储变得非常简单和高效。
不需要引用的类型:NULL、Boolean、Long、Double
需要引用的类型:String、Array、Object、Resource、Reference
3. 内部类型zend_string
Zend_string是实际存储字符串的结构体,实际的内容会存储在val(char,字符型)中,而val是一个char数组,长度为1(方便成员变量占位)。
结构体最后一个成员变量采用char数组,而不是使用char*,这里有一个小优化技巧,可以降低CPU的cache miss。
如果使用char数组,当malloc申请上述结构体内存,是申请在同一片区域的,通常是长度是sizeof(_zend_string) + 实际char存储空间。但是,如果使用char*,那个这个位置存储的只是一个指针,真实的存储又在另外一片独立的内存区域内。
使用char[1]和char*的内存分配对比:
从 逻辑实现的角度来看,两者其实也没有多大区别,效果很类似。而实际上,当这些内存块被载入到CPU的中,就显得非常不一样。前者因为是连续分配在 一起的同一块内存,在CPU读取时,通常都可以一同获得(因为会在同一级缓存中)。而后者,因为是两块内存的数据,CPU读取第一块内存的时候,很可能第 二块内存数据不在同一级缓存中,使CPU不得不往L2(二级缓存)以下寻找,甚至到内存区域查到想要的第二块内存数据。这里就会引起 CPU Cache Miss,而两者的耗时最高可以相差100倍。
另外,在字符串复制的时候,采用引用赋值,zend_string可以避免的内存拷贝。
6. PHP数组的变化(HashTable和Zend Array)
在 编写PHP程序过程中,使用最频繁的类型莫过于数组,PHP5的数组采用HashTable实现。如果用比较粗略的概括方式来说,它算是一个支持 双向链表的HashTable,不仅支持通过数组的key来做hash映射访问元素,也能通过foreach以访问双向链表的方式遍历数组元素。
PHP5的HashTable(截图来自于PPT):
这 个图看起来很复杂,各种指针跳来跳去,当我们通过key值访问一个元素内容的时候,有时需要3次的指针跳跃才能找对需要的内容。而最重要的一点, 就在于这些数组元素存储,都是分散在各个不同的内存区域的。同理可得,在CPU读取的时候,因为它们就很可能不在同一级缓存中,会导致CPU不得不到下级 缓存甚至内存区域查找,也就是引起CPU缓存命中下降,进而增加更多的耗时。
PHP7的Zend Array(截图来源于PPT):
新 版本的数组结构,非常简洁,让人眼前一亮。最大的特点是,整块的数组元素和hash映射表全部连接在一起,被分配在同一块内存内。如果是遍历一个 整型的简单类型数组,效率会非常快,因为,数组元素(Bucket)本身是连续分配在同一块内存里,并且,数组元素的zval会把整型元素存储在内部,也 不再有指针外链,全部数据都存储在当前内存区域内。当然,最重要的是,它能够避免CPU Cache Miss(CPU缓存命中率下降)。
Zend Array的变化:
- 数组的value默认为zval。
- HashTable的大小从72下降到56字节,减少22%。
- Buckets的大小从72下降到32字节,减少50%。
- 数组元素的Buckets的内存空间是一同分配的。
- 数组元素的key(Bucket.key)指向zend_string。
- 数组元素的value被嵌入到Bucket中。
- 降低CPU Cache Miss。
7. 函数调用机制(Function Calling Convention)
PHP7改进了函数的调用机制,通过优化参数传递的环节,减少了一些指令,提高执行效率。
PHP5的函数调用机制(截图来自于PPT):
图中,在vm栈中的指令send_val和recv参数的指令是相同,PHP7通过减少这两条重复,来达到对函数调用机制的底层优化。
PHP7的函数调用机制(截图来自于PPT):
8. 通过宏定义和内联函数(inline),让编译器提前完成部分工作
C 语言的宏定义会被在预处理阶段(编译阶段)执行,提前将部分工作完成,无需在程序运行时分配内存,能够实现类似函数的功能,却没有函数调用的压 栈、弹栈开销,效率会比较高。内联函数也类似,在预处理阶段,将程序中的函数替换为函数体,真实运行的程序执行到这里,就不会产生函数调用的开销。
PHP7在这方面做了不少的优化,将不少需要在运行阶段要执行的工作,放到了编译阶段。例如参数类型的判断(Parameters Parsing),因为这里涉及的都是固定的字符常量,因此,可以放到到编译阶段来完成,进而提升后续的执行效率。
例如下图中处理传递参数类型的方式,从左边的写法,优化为右边宏的写法。
三、小结
鸟哥的PPT里放出过一组对比数据,就是WordPress在PHP5.6执行100次会产生70亿次的CPU指令执行数目,而在PHP7中只需要25亿次,减少64.2%,这是一个令人震撼的数据。
在鸟哥的整个分享中,给我最深刻的一个观点是:要注意细节,很多个细小的优化,一点点持续地积累,积少成多,最终汇聚为惊艳的成果。为山九仞,岂一日之功,我想大概也是这个道理。
毫无疑问,PHP7在性能方面实现跨越式的提升,如果能够将这些成果应用在PHP的Web系统中,也许我们只需要更少的机器,就可以支撑起更高请求量的服务。PHP7正式版的发布,令人充满无限憧憬。
参考&引用资料:
鸟哥(惠新宸)的分享PPT,http://www.laruence.com/
PHP官方社区,http://php.net/
致谢:
感谢鸟哥(惠新宸)提供的帮助与支持。
相关推荐
其中,PHP作为Web开发中最常用的脚本语言之一,其开源框架的革新与发展备受关注。Openbiz,作为一款新兴的PHP开源框架,正以其独特的设计理念和强大的功能特性,引领着PHP开源框架的革新潮流。 ### Openbiz框架的...
- 随着硬件摩尔定律的发展,用户对软件的体验需求不断提升,性能优化成为了一个持续不断的过程。 - 性能优化不仅是提升用户体验的关键,也是确保产品品质的永恒话题。 2. **踩过的“坑”**: - 对于Android和iOS...
他强调了代码优化、安全性提升和性能调优的重要性,这些都是PHP开发者在实际工作中必须面对的关键问题。通过剖析具体的案例,技术主管展示了如何利用PHP处理高并发访问、数据安全威胁及提高用户体验等挑战。 ### ...
1. 性能优化 5.4.8在编译器和运行时层面进行了优化,提高了处理速度,降低了资源消耗。这得益于ZEND引擎的改进,如优化的垃圾回收机制和更快的字节码缓存。 2. 错误处理 5.4.8增强了错误报告,提供更详细的错误信息...
PHP7是PHP历史上的一个里程碑,性能提升超过100%,这得益于一系列的技术革新。其中,PHP7.1引入了静态单赋值(Static Single Assignment, SSA)的数据流分析,这一优化方法使得代码执行更高效。SSA通过分析变量的...
在此过程中,将遇到的挑战转化为学习机会,不断优化代码结构和性能。 #### 结语 学习Ajax与PHP5的融合并非一蹴而就,它需要对相关技术有深刻的理解和实践。通过系统学习基础知识,积极参与社区交流,以及动手实践...
除了性能上的优势,JPHP还支持使用Java的类库,使得PHP与Java的集成变得更加无缝。 另外,JPHP的出现也让PHP开发者有了更多的选择空间。它的目标并不是取代现有的PHP引擎,比如ZendPHP或者Facebook的HHVM,而是提供...
3. **强大的性能优化**:为了提高网站的响应速度和处理能力,IIS7对缓存机制进行了优化,并且支持HTTP压缩,减少了网络传输的数据量。 4. **丰富的应用开发支持**:IIS7不仅支持传统的ASP.NET应用程序,还支持PHP、...
聚丙烯酰胺则通过改善泥浆的触变性和黏度,减少固相含量,进而优化了泥浆的性能;纯碱和氢氧化钠的加入则用来调整泥浆的pH值,增强其黏度,促进黏土颗粒的有效分散。 在实际施工案例中,例如某独塔空间扭索面跨河...
此外,后端代码的优化还包括了对服务器端编程语言的升级,例如从PHP5过渡到PHP7,显著提高了执行效率和资源利用率。这样的改进不仅提升了系统的稳定性和安全性,也为今后的功能扩展和维护打下了坚实的基础。 对于...
1. **核心改进**:vbb 3.0 beta 7 在性能上进行了大幅度提升,可能包括数据库查询优化、负载均衡策略改进等,使得论坛在高流量环境下依然能够保持流畅运行。同时,它可能引入了新的架构设计,以支持更复杂的模块化...
PHP 7.0.2正式版发布标志着PHP语言自2004年以来的重大飞跃,它不仅是第七个主要版本的更新,更是性能和功能上的一次全面革新。在这一版本中,PHP 7实现了对语言性能的显著提升,尤其是在Web应用的执行效率上,例如...
PHP 7带来了巨大的性能提升,并且引入了新的语法特性,比如标量类型声明、返回类型声明以及太空船操作符等。Netbeans 作为PHP的官方集成开发环境,其编辑器针对PHP7进行了优化,使得开发者在编写代码时能享受到更加...
综上所述,jmapcms网站开发系统v1.2版本通过一系列的技术革新与优化措施,在安全性、性能、用户体验等方面都取得了显著的进步。这些改进不仅为最终用户带来了更好的使用体验,也为开发人员提供了更为强大且灵活的...
其简便的语法和高效率的执行性能,使得帝国CMS能够快速响应用户请求,灵活地进行内容管理。此外,PHP的跨平台性和开源特性,为开发者提供了更多的自由度,降低了开发和维护成本。 帝国CMS的功能设计充分考虑了新闻...
5. **测试优化**:在上线前进行全面的功能测试和性能优化,确保网站稳定运行。 6. **上线与推广**:正式发布网站,并通过SEO、SEM、社交媒体营销等方式进行推广,吸引流量。 7. **持续维护**:定期更新内容,修复...
在这个过程中,技术团队不断优化性能,例如批量处理速度达到154毫秒,实现了高可用性,即使面临单机或集群故障也能保证服务稳定。 总的来说,百度贴吧的架构变迁历程体现了互联网产品在面对流量、功能和技术创新...
Zend 引擎是 PHP 的核心组件,负责解析、执行 PHP 代码并提供性能优化。本节主要关注 Zend 引擎如何推动 PHP 从一个纯面向过程的脚本语言演变为支持面向对象编程(OOP)的语言。 1997 年,PHP3 的诞生标志着 PHP ...