Web缓存最权威的资料就属RFC了,可惜它太过言简意赅,本文将对缓存做一些通俗易懂的介绍。
为了演示体现缓存的作用,先删除所有的浏览器缓存,然后以如下四种方式访问baidu网站,期间使用Pagetest作为测试软件,这是一个搭配IE使用的软件,功能上类似HttpWatch,不过它是免费的,有关Pagetest的用法可以参考官方文章提供的教程:
1. 打开IE,键入百度网址,按回车:
========================================================================================
========================================================================================
在此次访问中,因为客户端没有相应缓存,所以浏览器向每一个Web组件发出请求。
2. 打开IE,键入百度网址,按回车:
========================================================================================
========================================================================================
在此次访问中,因为客户端已有部分缓存,所以浏览器的请求数明显减少。
3. 在一个已经打开百度网址的浏览器窗口里,按F5刷新:
========================================================================================
========================================================================================
在此次访问中,客户端刷新,服务端判断缓存未过期便返回304(黄色部分),客户端继续使用缓存。在刷新过程中,浏览器在请求的时候,如果有缓存,会通过发送If-Modified-Since或If-None-Match到服务器去验证缓存是否有效。
4. 在一个已经打开百度网址的浏览器窗口里,按Ctrl+F5强制刷新:
========================================================================================
========================================================================================
在此次访问中,客户端强制刷新,不管客户端有没有缓存,每一个Web组件都重新请求。在强制刷新过程中,浏览器在请求的时候,即便有缓存,也不会发送If-Modified-Since或If-None-Match,这样,任何Web组件都必须从服务器重新下载才能显示。
Expires / Cache-Control:
当服务器发出响应的时候,可以通过两种方式来告诉客户端缓存请求:
第一种是Expires,比如:
Expires: Sun, 16 Oct 2016 05:43:02 GMT
在此日期之前,客户端都会认为缓存是有效的。
不过Expires有缺点,比如说,服务端和客户端的时间设置可能不同,这就会使缓存的失效可能并不能精确的按服务器的预期进行。
第二种是Cache-Control,比如:
Cache-Control: max-age=315360000
这里声明的是一个相对的秒数,表示从现在起,315360000秒内缓存都是有效的,这样就避免了服务端和客户端时间不一致的问题。
但是Cache-Control是HTTP1.1才有的,不适用与HTTP1.0,而Expires既适用于HTTP1.0,也适用于HTTP1.1,所以说在大多数情况下同时发送这两个头会是一个更好的选择,当客户端两种头都能解析的时候,会优先使用Cache-Control。
参考Apache相关文档
条件GET:Last-Modified / If-Modified-Since和ETag / If-None-Match
Last-Modified / If-Modified-Since
Last-Modified是响应头,If-Modified-Since是请求头。Last-Modified把Web组件的最后修改时间告诉客户端,客户端在下次请求此Web组件的时候,会把上次服务端响应的最后修改时间作为If-Modified-Since的值发送给服务器,服务器可以通过这个值来判断是否需要重新发送,如果不需要,就简单的发送一个304状态码,客户端将从缓存里直接读取所需的Web组件。
ETag / If-None-Match
ETag是响应头,If-None-Match是请求头。Last-Modified / If-Modified-Since的主要缺点就是它只能精确到秒的级别,一旦在一秒的时间里出现了多次修改,那么Last-Modified / If-Modified-Since是无法体现的。相比较,ETag / If-None-Match没有使用时间作为判断标准,而是使用一个特征串。Etag把Web组件的特征串告诉客户端,客户端在下次请求此Web组件的时候,会把上次服务端响应的特征串作为If-None-Match的值发送给服务端,服务端可以通过这个值来判断是否需要从重新发送,如果不需要,就简单的发送一个304状态码,客户端将从缓存里直接读取所需的Web组件。
一些建议:
当使用Expires / Cache-Control的时候,尽量给图片,样式表,脚本等设置一个足够大的缓存时间,如果在此期间,缓存文件有过修改,最简单的更新方式是改名或者设置一个查询参数,比如开始图片名是logo.gif,如果做了一个新的图片,你想更新,可以把图片改名为logo_v2.gif,或者给图片设置一个查询参数logo.gif?foobar,这样,浏览器就会去请求新的图片了。不过,并不是所有的Web组件都适合有一个大的缓存时间,比如html,就不适合使用过大的缓存时间,否则你在缓存到期前,就没机会更新任何东西了。
使用Yslow的都知道,它不建议使用ETag,理由是Etag在分布式环境里,会给服务器造成不必要的压力,比如说在Apache里,Etag缺省是由三个因素决定的:INode Size MTime,而同一个图片,在不同服务器上的INode是不同的,所以在两个服务器上先后请求同一个图片,会得到两次200,虽然我们可以通过设置FileETag Size MTime来屏蔽INode,从而达到一次200,一次304的效果,但304也是要通过一次条件GET请求验证的,所以说,还是通过Expires / Cache-Control来设置一个足够大的缓存时间更划算一些,如此说来,对图片,样式表,脚本等静态内容而言,设置一个大的过期时间是绝对必要的,而Etag和Last-Modified则不是必要的。
如果你决定禁止ETag的话,简单的使用FileETag None就能达到目的。
如果你想把Last-Modified也禁止的话,似乎没有直接的方法,只能通过header模块的方式:
LoadModule headers_module modules/mod_headers.so
<FilesMatch “…”>
Header unset Last-Modified
</FilesMatch>
不理解缓存可能会让我们作出很多错误的判断,比如说很多人在估算带宽的时候一般是按照如下的流程来计算带宽的(以每天百万访问量为例来说明):
如果100万PV的访问量在一天内平均分布的话,折合到每秒大约12次访问,如果按平均每次访问页面的大小是100K字节左右计算的话,这12次访 问总计大约就是1200K字节,字节的单位是Byte,而带宽的单位是bit,它们之间的关系是1Byte = 8bit,所以1200K Byte大致就相当于9600K bit,也就是9Mbps的样子,实际情况中,我们的网站必须能在峰值流量时保持正常访问,假设峰值流量是平均流量的5倍,于是得出真实带宽的需求应该在45Mbps 左右。
如上的计算只在一种情况下是正确的,那就是网站服务器关闭了缓存或者网站的浏览者关闭了缓存!不过现实情况我们出于性能的考虑肯定要加入缓存,用户在有缓存的情况下产生的流量要远远小于没有缓存时产生的流量。所以在估算带宽的时候,我们还得考虑携带缓存浏览的浏览者在总浏览者中所占的比例,说白了就是回头客的比例,这样才能作出准确的判断,否则会多花很多冤枉钱。
参考资料:Caching Tutorial for Web Authors and Webmasters(英文版)(中文版)
分享到:
相关推荐
服务器缓存是提升网站或应用性能的关键技术,它通过存储常用数据或计算结果,减少对主服务器或外部资源的访问,从而显著加快响应速度。在本文中,我们将深入探讨服务器缓存的工作原理、常见类型、设置方法以及如何...
服务器缓存监视器是一款专为服务器设计的全面监控工具,其主要目的是为了帮助系统管理员实时了解服务器的缓存性能,确保系统的稳定运行和高效数据处理。缓存是现代计算环境中至关重要的一部分,它能够提高数据访问...
在构建大型网站时,Web服务器缓存是一种至关重要的优化策略,它可以显著提高系统性能和响应速度,降低服务器负载。本文将深入探讨四种主要的缓存技术:CDN缓存、反向代理缓存、应用程序缓存和分布式缓存,以及讨论...
查看服务器缓存工具
### Web代理服务器缓存设计详解 #### 一、引言 随着互联网的快速发展,Web应用的需求日益增加,用户数量呈指数级增长。然而,现有的网络基础设施往往无法满足如此大规模的数据传输需求,尤其是在传输延迟方面。...
### 定时更新服务器缓存信息 #### 背景介绍 在现代互联网技术中,缓存技术被广泛应用于提高网站性能、降低数据库负载及提升用户体验等方面。然而,随着网站流量的增长以及数据的变化,如果不及时更新缓存中的数据,...
web服务器缓存实现原理,通过chrome f12观察web服务器缓存 后台action命中缓存hit Via X-cache X-Cache-Lookup
标题:“Web应用服务器缓存浅谈PPT” 在Web开发中,服务器缓存是一种提高性能和响应速度的关键技术。本讲座将探讨Web应用服务器缓存的基础知识,包括其工作原理、常见类型和最佳实践。通过学习,我们可以更好地理解...
### 2013年预测:存储闪存用于服务器缓存 #### 一、概述 在2013年的IT预测中,一个重要的趋势是**存储闪存**(特别是固态存储SSD)用于服务器缓存的应用正在逐渐兴起。这项技术能够显著提高服务器的响应速度和整体...
### 流媒体服务器缓存技术研究 #### 一、引言 随着互联网视频点播(VOD)服务的日益普及,用户对于流媒体服务器的交互访问需求显著增加。然而,流媒体服务面临着诸多挑战,其中最主要的瓶颈之一就是磁盘I/O带宽及...
网络存储服务器缓存替换策略研究 缓存替换策略是影响网络存储服务器性能和效率的关键因素之一。常见的缓存替换策略有 LRU(Least Recently Used)算法、LRU-K 算法、LRU-M 算法、FIFO(First In First Out)算法和 ...
流媒体服务器缓存技术在现代互联网服务中扮演着至关重要的角色,尤其是在视频点播(VOD)和视频回放(VCR)等高带宽需求的应用场景中。本研究聚焦于流媒体服务器缓存技术,旨在优化缓存策略,提高缓存效率,减少网络...
"服务器缓存调节工具"则说明了它的主要功能,即用于优化服务器性能,通过存储和快速检索数据来减轻数据库的压力。 描述部分进一步解释了该工具的作用,它能够帮助管理和调整服务器的缓存,以提升服务器的访问效率。...
Xml服务器缓存,即XmlCache,是一个针对服务器端应用程序设计的高效、轻量级的缓存解决方案,旨在替代传统的Application和Session功能。在ASP.NET或其他Web应用开发中,Application和Session通常用于存储用户会话...
以下将详细介绍关于“web服务器缓存静态资源,更新静态资源的规则”以及HTTP状态码304的相关知识点。 首先,静态资源的缓存分为两种类型:强缓存和协商缓存。强缓存主要通过`Cache-Control`或`Expires`响应头来控制...
通过理解这些基本概念和特性,你可以根据实际需求有效地利用 Redis 缓存服务器来优化应用程序性能,提高系统响应速度,并确保数据的安全性和一致性。无论是在 web 应用、数据统计、实时分析还是消息传递等领域,...
基于段流行度的移动流媒体代理服务器缓存算法,杨戈,廖建新,提出了一种基于段流行度的移动流媒体代理服务器缓存算法P2CAS2M2(Proxy Caching Algorithm Based on Segment Popularity for Mobile Streaming Media)...
memcachedump是一个用于将公开的memcached服务器缓存内容转储到本地文本文件的工具