`
liudaoru
  • 浏览: 1575068 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

网页加速的14条优化法则[z]

    博客分类:
  • Ajax
阅读更多

最近,YouMonitor.Us在做Web应用性能优化,在网上发现了文章High Performance Web Sites: The Importance of Front-End Performance,感觉其14条优化法则很实用,操作性很强。因此翻译出来,供大家参考。

<o:p> </o:p>

Web应用性能优化黄金法则:先优化前端程序(front-end)的性能,因为这是80%或以上的最终用户响应时间的花费所在。<o:p></o:p>

法则1. 减少HTTP请求次数

80%的最终用户响应时间花在前端程序上,而其大部分时间则花在各种页面元素,如图像、样式表、脚本和Flash等,的下载上。减少页面元素将会减少HTTP请求次数。这是快速显示页面的关键所在。

一种减少页面元素个数的方法是简化页面设计。但是否存在其他方式,能做到既有丰富内容,又能获得快速响应时间呢?以下是这样一些技术:

Image maps组合多个图片到一张图片中。总文件大小变化不大,但减少了HTTP请求次数从而加快了页面显示速度。该方式只适合图片连续的情况;同时坐标的定义是烦人又容易出错的工作。

CSS Sprites是更好的方法。它可以组合页面中的图片到单个文件中,并使用CSSbackground-imagebackground-position属性来现实所需的部分图片。

Inline images使用data: URL scheme来在页面中内嵌图片。这将增大HTML文件的大小。组合inline images到你的(缓存)样式表是既能较少HTTP请求,又能避免加大HTML文件大小的方法。

Combined files通过组合多个脚本文件到单一文件来减少HTTP请求次数。样式表也可采用类似方法处理。这个方法虽然简单,但没有得到大规模的使用。10大美国网站每页平均有7个脚本文件和2个样式表。当页面之间脚本和样式表变化很大时,该方式将遇到很大的挑战,但如果做到的话,将能加快响应时间。

<o:p> </o:p>

减少HTTP请求次数是性能优化的起点。这最提高首次访问的效率起到很重要的作用。据Tenni Theurer的文章Browser Cache Usage - Exposed!描述,40-60%的日常访问是首次访问,因此为首次访问者加快页面访问速度是用户体验的关键。

法则2. 使用CDN(Content Delivery Network, 内容分发网络)

用户离web server的远近对响应时间也有很大影响。从用户角度看,把内容部署到多个地理位置分散的服务器上将有效提高页面装载速度。但是该从哪里开始呢?

作为实现内容地理分布的第一步,不要试图重构web应用以适应分布架构。改变架构将导致多个周期性任务,如同步session状态,在多个server之间复制数据库交易。这样缩短用户与内容距离的尝试可能被应用架构改版所延迟,或阻止。

我们还记得80-90%的最终用户响应时间花在下载页面中的各种元素上,如图像文件、样式表、脚本和Flash等。与其花在重构系统这个困难的任务上,还不如先分布静态内容。这不仅能大大减少响应时间,而且由于CDN的存在,分布静态内容非常容易实现。

CDN是地理上分布的web server的集合,用于更高效地发布内容。通常基于网络远近来选择给具体用户服务的web server

一些大型网站拥有自己的CDN,但是使用如Akamai Technologies, Mirror Image Internet, Limelight NetworksCDN服务提供商的服务将是划算的。在Yahoo!把静态内容分布到CDN减少了用户影响时间20%或更多。切换到CDN的代码修改工作是很容易的,但能达到提高网站的速度。

法则3. 增加Expires Header

网页内容正变得越来越丰富,这意味着更多的脚本文件、样式表、图像文件和Flash。首次访问者将不得不面临多次HTTP请求,但通过使用Expires header,您可以在客户端缓存这些元素。这在后续访问中避免了不必要的HTTP请求。Expires header最常用于图像文件,但是它也应该用于脚本文件、样式表和Flash

浏览器(和代理)使用缓存来减少HTTP请求的次数和大小,使得网页加速装载。Web server通过Expires header告诉客户端一个元素可以缓存的时间长度。

如果服务器是Apache的话,您可以使用ExpiresDefault基于当期日期来设置过期日期,如:

ExpiresDefault “access plus 10 years” 设置过期时间为从请求时间开始计算的10年。

请记住,如果使用超长的过期时间,则当内容改变时,您必须修改文件名称。在Yahoo!我们经常把改名作为release的一个步骤:版本号内嵌在文件名中,如yahoo_<st1:chsdate month="12" islunardate="False" day="30" year="1899" w:st="on" isrocdate="False">2.0.6</st1:chsdate>.js

法则4. 压缩页面元素

通过压缩HTTP响应内容可减少页面响应时间。从HTTP/1.1开始,web客户端在HTTP请求中通过Accept-Encoding头来表明支持的压缩类型,如:

Accept-Encoding: gzip, deflate.

如果Web server检查到Accept-Encoding头,它会使用客户端支持的方法来压缩HTTP响应,会设置Content-Encoding头,如:Content-Encoding: gzip

Gzip是目前最流行及有效的压缩方法。其他的方式如deflate,但它效果较差,也不够流行。通过Gzip,内容一般可减少70%。如果是Apache,在1.3版本下需使用mod_gzip模块,而在2.x版本下,则需使用mod_deflate

Web server根据文件类型来决定是否压缩。大部分网站对HTML文件进行压缩。但对脚本文件和样式表进行压缩也是值得的。实际上,对包括XMLJSON在内的任务文本信息进行压缩都是值得的。图像文件和PDF文件不应该被压缩,因为它们本来就是压缩格式保存的。对它们进行压缩,不但浪费CPU,而且还可能增加文件的大小。

因此,对尽量多的文件类型进行压缩是一种减少页面大小和提高用户体验的简便方法。

法则5. 把样式表放在头上

我们发现把样式表移到HEAD部分可以提高界面加载速度,因此这使得页面元素可以顺序显示。

在很多浏览器下,如IE,把样式表放在document的底部的问题在于它禁止了网页内容的顺序显示。浏览器阻止显示以免重画页面元素,那用户只能看到空白页了。Firefox不会阻止显示,但这意味着当样式表下载后,有些页面元素可能需要重画,这导致闪烁问题。

HTML规范明确要求样式表被定义在HEAD中,因此,为避免空白屏幕或闪烁问题,最好的办法是遵循HTML规范,把样式表放在HEAD中。

法则6. 把脚本文件放在底部

与样式文件一样,我们需要注意脚本文件的位置。我们需尽量把它们放在页面的底部,这样一方面能顺序显示,另方面可达到最大的并行下载。

浏览器会阻塞显示直到样式表下载完毕,因此我们需要把样式表放在HEAD部分。而对于脚本来说,脚本后面内容的顺序显示将被阻塞,因此把脚本尽量放在底部意味着更多内容能被快速显示。

脚本引起的第二个问题是它阻塞并行下载数量。HTTP/1.1规范建议浏览器每个主机的并行下载数不超过2个。因此如果您把图像文件分布到多台机器的话,您可以达到超过2个的并行下载。但是当脚本文件下载时,浏览器不会启动其他的并行下载,甚至其他主机的下载也不启动。

在某些情况下,不是很容易就能把脚本移到底部的。如,脚本使用document.write方法来插入页面内容。同时可能还存在域的问题。不过在很多情况下,还是有一些方法的。

一个备选方法是使用延迟脚本(deferred script)。DEFER属性表明脚本未包含document.write,指示浏览器刻继续显示。不幸的是,Firefox不支持DEFER属性。在IE中,脚本可能被延迟执行,但不一定得到需要的长时间延迟。不过从另外角度来说,如果脚本能被延迟执行,那它就可以被放在底部了。

法则7. 避免CSS表达式

CSS表达式是功能强大的(同时也是危险的)用于动态设置CSS属性的方式。IE,从版本5开始支持CSS表达式,如backgourd-color: expression((new Date()).getHours()%2?”#B8D4FF”:”#F<st1:chmetcnv w:st="on" hasspace="False" negative="False" numbertype="1" sourcevalue="8" unitname="a" tcsc="0">08A</st1:chmetcnv><st1:chmetcnv w:st="on" hasspace="False" negative="False" numbertype="1" sourcevalue="0" unitname="”" tcsc="0">00”</st1:chmetcnv>),即背景色每个小时切换一次。

CSS表达式的问题是其执行次数超过大部分人的期望。不仅页面显示和resize时计算表达式,而且当页面滚屏,甚至当鼠标在页面上移动时都会重新计算表达式。

一种减少CSS表达式执行次数的方法是一次性表达式,即当第一次执行时就以明确的数值代替表达式。如果必须动态设置的话,可使用事件处理函数代替。如果您必须使用CSS表达式的话,请记住它们可能被执行上千次,从而影响页面性能。

法则8. JavaScriptCSS放到外部文件中

上述很多性能优化法则都基于外部文件进行优化。现在,我们必须问一个问题:JavaScriptCSS应该包括在外部文件,还是在页面文件中?

在现实世界中,使用外部文件会加快页面显示速度,因为外部文件会被浏览器缓存。如果内置JavaScriptCSS在页面中虽然会减少HTTP请求次数,但增大了页面的大小。另外一方面,使用外部文件,会被浏览器缓存,则页面大小会减小,同时又不增加HTTP请求次数。

因此,一般来说,外部文件是更可行的方式。唯一的例外是内嵌方式对主页更有效,如Yahoo!My Yahoo!都使用内嵌方式。一般来说,在一个session中,主页访问此时较少,因此内嵌方式可以取得更快的用户响应时间。

法则9. 减少DNS查询次数

DNS用于映射主机名和IP地址,一般一次解析需要20120毫秒。为达到更高的性能,DNS解析通常被多级别地缓存,如由ISP或局域网维护的caching server,本地机器操作系统的缓存(如windows上的DNS Client Service),浏览器。IE的缺省DNS缓存时间为30分钟,Firefox的缺省缓冲时间是1分钟。

减少主机名可减少DNS查询的次数,但可能造成并行下载数的减少。避免DNS查询可减少响应时间,而减少并行下载数可能增加响应时间。一个可行的折中是把内容分布到至少2个,最多4个不同的主机名上。

法则10. 最小化JavaScript代码

最小化JavaScript代码指在JS代码中删除不必要的字符,从而降低下载时间。两个流行的工具是JSMin YUI Compressor

混淆是最小化于源码的备选方式。象最小化一样,它通过删除注释和空格来减少源码大小,同时它还可以对代码进行混淆处理。作为混淆的一部分,函数名和变量名被替换成短的字符串,这使得代码更紧凑,同时也更难读,使得难于被反向工程。Dojo Compressor (ShrinkSafe)是最常见的混淆工具。

最小化是安全的、直白的过程,而混淆则更复杂,而且容易产生问题。从对美国10大网站的调查来看,通过最小化,文件可减少21%,而混淆则可减少25%

除了最小化外部脚本文件外,内嵌的脚本代码也应该被最小化。即使脚本根据法则4被压缩后传输,最小化脚本刻减少文件大小5%或更高。

法则11. 避免重定向

重定向功能是通过301302这两个HTTP状态码完成的,如:

      HTTP/1.1 301 Moved Permanently
      Location: http://example.com/newuri
      Content-Type: text/html

<o:p> </o:p>

浏览器自动重定向请求到Location指定的URL上,重定向的主要问题是降低了用户体验。

一种最耗费资源、经常发生而很容易被忽视的重定向是URL的最后缺少/,如访问http://astrology.yahoo.com/astrology将被重定向到http://astrology.yahoo.com/astrology/。在Apache下,可以通过Aliasmod_rewriteDirectorySlash等方式来解决该问题。

法则12. 删除重复的脚本文件

在一个页面中包含重复的JS脚本文件会影响性能,即它会建立不必要的HTTP请求和额外的JS执行。

不必要的HTTP请求发生在IE下,而Firefox不会产生多余的HTTP请求。额外的JS执行,不管在IE下,还是在Firefox下,都会发生。

一个避免重复的脚本文件的方式是使用模板系统来建立脚本管理模块。除了防止重复的脚本文件外,该模块还可以实现依赖性检查和增加版本号到脚本文件名中,从而实现超长的过期时间。

法则13. 配置ETags

ETags是用于确定浏览器缓存中元素是否与Web server中的元素相匹配的机制,它是比last-modified date更灵活的元素验证机制。ETag是用于唯一表示元素版本的字符串,它需被包括在引号中。Web server首先在response中指定ETag

      HTTP/1.1 200 OK
10c24bc-4ab-457e<st1:chmetcnv w:st="on" hasspace="False" negative="False" numbertype="1" sourcevalue="1" unitname="C" tcsc="0">1c</st1:chmetcnv><st1:chmetcnv w:st="on" hasspace="False" negative="False" numbertype="1" sourcevalue="1" unitname="F" tcsc="0">1f</st1:chmetcnv>"
      Content-Length: 12195

后来,如果浏览器需要验证某元素,它使用If-None-Match头回传ETagWeb server,如果ETag匹配,则服务器返回304代码,从而节省了下载时间:

      GET /i/yahoo.gif HTTP/1.1
      Host: us.yimg.com
10c24bc-4ab-457e<st1:chmetcnv w:st="on" hasspace="False" negative="False" numbertype="1" sourcevalue="1" unitname="C" tcsc="0">1c</st1:chmetcnv><st1:chmetcnv w:st="on" hasspace="False" negative="False" numbertype="1" sourcevalue="1" unitname="F" tcsc="0">1f</st1:chmetcnv>"
      HTTP/1.1 304 Not Modified

<o:p> </o:p>

ETags的问题在于它们是基于服务器唯一性的某些属性构造的,如Apache1.32.x,其格式是inode-size-timestamp,而在IIS5.06.0下,其格式是Filetimestamp:ChangeNumber。这样同一个元素在不同的web server上,其ETag是不一样的。这样在多Web server的环境下,浏览器先从server1请求某元素,后来向server2验证该元素,由于ETag不同,所以缓存失效,必须重新下载。

因此,如果您未用到ETags系统提供的灵活的验证机制,最好删除ETag。删除ETag会减少http response及后续请求的HTTP头的大小。微软支持文章描述了如何删除ETags,而在Apache下,只要在配置文件中设置FileETag none即可。

法则14. 缓存Ajax

性能优化法则同样适用于web 2.0应用。提高Ajax的性能最重要的方式是使得其response可缓存,就象“法则3增加Expires Header”讨论的那样。以下其他法则同样适用于Ajax,当然法则3是最有效的方式:

法则4. 压缩页面元素

法则9. 减少DNS查询次数

法则10. 最小化脚本文件

法则11. 避免重定向

法则13. 配置ETags.

分享到:
评论

相关推荐

    步进电机S型曲线,SPTA加速算法.7z

    本资料“步进电机S型曲线,SPTA加速算法.7z”主要探讨了两种常见的步进电机加速算法:S型曲线算法和SPTA(Step Pulse Time Acceleration)算法。 S型曲线加速算法,也称为梯形速度曲线,是一种平滑的加减速策略。在...

    推荐 CSS+3D 旋转网页特效

    合理利用硬件加速,并结合JavaScript进行动态调整,可以有效优化性能。 10. **示例代码与实践** 通过以下代码,你可以创建一个简单的3D旋转立方体: ```html &lt;div class="face front"&gt;Front ...

    网页设计资源

    - **布局设计**:包括网格系统、F型布局、Z型布局等,是网页视觉效果和用户体验的关键。 - **色彩理论**:理解色彩如何影响用户情绪并应用于网页设计,如色彩搭配、对比度和色彩心理学。 - **字体选择**:不同的...

    遗传算法优化BP神经网络

    遗传算法则是模拟生物进化过程的一种全局优化方法。它基于达尔文的“适者生存”原则,通过选择、交叉和变异等操作来搜索解决方案空间,寻找最优解。遗传算法的优势在于其全局搜索能力和并行处理特性,能有效避免陷入...

    复数梯度的详细介绍

    此时,复数梯度可以帮助快速找到下降方向,从而加速优化过程。 #### 复数二阶梯度 ##### 定义 复数二阶梯度(或称为Hessian矩阵)是指函数\( f(z) \)关于复变量\( z \)及其共轭\( z^* \)的二阶偏导数组成的矩阵。...

    BP:算法1-4_matlabBP神经网络_parallel47z_BP算法_actualsw6_

    压缩包内的“BP:算法1-4”可能包含四个不同的BP神经网络实现,分别对应了不同的网络结构、优化策略或者训练技巧: 1. 算法1:基础的BP神经网络,通常包括前向传播和反向传播两个步骤,用于更新网络权重。 2. 算法2...

    8专题 精通模拟退火算法通过matlab建模案例.7z

    模拟退火算法是一种启发式搜索方法,源自固体物理中的退火过程,被广泛应用于解决复杂的优化问题,如旅行商问题、图着色问题等。在MATLAB中,模拟退火算法可以通过编程实现,以找到问题的近似最优解。本专题深入探讨...

    阿里云技术面试红宝书.7z

    这份7z压缩包包含了核心知识点的PDF文档,旨在帮助应聘者提升技能,顺利通过阿里云的面试。 一、大数据领域 1. Hadoop生态体系:理解HDFS(分布式文件系统)、MapReduce计算框架、YARN资源调度器的基础原理及其...

    非线性方程组迭代法[参照].pdf

    埃特金Aitken加速法则可以提高已有迭代法的收敛速度,对于已有的迭代序列有一定的优化效果。 在软件开发中,选择哪种方法取决于问题的具体情况,如对计算效率的要求、是否容易获取函数导数以及对精度的需求等。通过...

    fast alm for minimizing the sum of two convex functions.pdf

    例如,在优化问题(1.1)中,f(x)和g(x)是两个需要优化的凸函数,且对于任何τ &gt; 0和z ∈ R^n,可以容易地求解问题(1.2)和(1.3)。当解决(1.2)或(1.3)的复杂度与计算f(x)或g(x)的梯度(或次梯度)相当时,这类问题特别...

    消隐算法_消隐算法_

    在实际编程过程中,还需要考虑优化问题,比如避免不必要的计算,使用适当的缓存策略,以及合理利用硬件加速。此外,对于复杂的3D场景,可能需要结合多种消隐算法,或者使用更高级的光照和阴影模型来进一步提升图像的...

    关于BP算法推导过程与讨论

    \[\frac{\partial E}{\partial z_j} = \sum_k \left( \frac{\partial E}{\partial z_k} \frac{\partial z_k}{\partial a_j} \right) f'(z_j)\] #### 3. 网络结构、学习次数与误差精度的关系 网络的结构(包括层数、...

    JAVA实现BP算法.pdf

    误差通过网络反向传播,根据链式法则计算各层节点的误差梯度,进而更新权重。权重更新公式为:`Δw = -η * δ * z^T`,其中`η`是学习率,`δ`是误差项,`z`是输入项。 5. **动量因子**: 为了加速收敛并防止...

    数字信号处理 快速傅立叶变换

    除了基2算法和线性调频Z变换,还有其他的一些FFT变体和优化算法,例如分裂基算法,它通过分解复数乘法为实数运算来进一步减少计算量。此外,还有很多如Bit-reverse、Butterfly等结构和技巧,用于改善FFT的计算效率和...

    计算机图形学实验,包括图形学的四个基本算法的源代码

    通常采用梯形法则或者光栅化方法,其中每条边被转换成一系列水平线段,然后填充这些线段所覆盖的像素。这个算法在3D渲染和2D图形绘制中非常关键。 3. **深度缓冲(Z-Buffering)**:在3D图形中,当多个物体在同一...

    计算机图形学chap9 .ppt

    - **混合算法**:深度排序算法、区域细分算法和光线投射算法则介于两者之间。 2. **深度缓存器算法(Z-buffer)**: - **基本原理**:深度缓存器与帧缓存配合工作,其中帧缓存存储像素颜色,Z缓存存储对应像素的...

    BP网络的重要函数和功能与字母实例

    3. **Softmax函数**:\(\sigma(z)_j = \frac{e^{z_j}}{\sum_{k=1}^K e^{z_k}}\)。常用于多分类任务,将输出转换为概率分布。 4. **交叉熵损失函数**:\(L(y, \hat{y}) = -\sum_{i=1}^N y_i \log(\hat{y}_i)\)。用于...

    球面的透视动态隐藏线算法

    在本案例中,可能采用了优化策略,如使用Z缓冲区或扫描线算法来加速处理过程。Z缓冲区是一个存储每个像素深度值的数组,通过比较新绘制的像素和已有像素的深度,可以快速决定是否需要更新屏幕。扫描线算法则通过...

Global site tag (gtag.js) - Google Analytics