原理
浏览器的缓存的意义在于减少网络流量,为了达到这个目的,采用了两个手段
1、减少客户端对服务器的请求
解决方案是:为每个资源设置一个有效期限。
在客户端取得资源后,缓存在本地,一段时间内,如果再次展示这个资源时,不再向服务器发出请求,而是直接取缓存的内容。
相对应的编程手段就是
1. 在Htpp的Header中指定Cache-Control:max-age=xxx(秒)
2. 或 Expires= Tue, 28 Apr 2015 15:50:47 GMT (这里必须是GMT时间)
以上这两者都存在时,Cache-Control 优先。
2、服务器不传输重复的内容。
解决方案是:服务器为每个资源打上一个标记(或时间戳)。
这些标记会连同资源一起发送给客户端,客户端在请求时,如果缓存中已经有这个资源,就把这些标记发回给服务器,服务器根据这些标记判断是否重新发送。相对应的编程手段是
A. Htpp的Header中指定Last-Modified / If-Modified-Since ,服务端发送资源是带上Last-Modified,客户端请求时带上If-Modified-Since,服务端判断到资源未变时,响应 304 状态码。这两个也都是GMT 时间格式
B Htpp的Header中指定 ETag / If-None-Match ,服务端发送资源是带上ETag ,客户端请求时带上If-None-Match,服务端判断到资源未变时,响应 304 状态码。ETag 通常可以对资源计算MD5码后得到。
其它设置
有些资源不适合用缓存,比如动态的数据,或者涉及安全的数据,所以Cache-Control 还有几个策略值:
no-cache: 不缓存,客户端每次都要重新请求资源。
Public :可以在代理服务器上缓存(比如客户的ISP上建立的代理服务器)
Private :只能在客户端缓存,代理服务器不能缓存
no-store :不保存到文件中
另外还有些不常见的Cach-Control的设置,比如
min-refresh: 在不到max-age时就去请求新资源
max-stale : 能够接受过期的内容
另外,还有些涉及到代理服务器,CDN 如何更新缓存内容的一些策略控制。详细的内容可参考 http://tools.ietf.org/html/rfc2616#section-14.9 。
浏览器对缓存的处理
浏览器根据以上的设置,以有用户操作,来决定缓存的处理方式:
1) 打开新窗口 值为private、no-cache、must-revalidate,那么打开新窗口访问时都会重新访问服务器。 而如果指定了max-age值,那么在此值内的时间里就不会重新访问服务器,例如: Cache-control: max-age=5(表示当访问此网页后的5秒内再次访问不会去服务器)
2) 在地址栏回车 值为private或must-revalidate则只有第一次访问时会访问服务器,以后就不再访问。 值为no-cache,那么每次都会访问。 值为max-age,则在过期之前不会重复访问。
3) 按后退按扭 值为private、must-revalidate、max-age,则不会重访问, 值为no-cache,则每次都重复访问
4) 按刷新按扭 无论为何值,都会重复访问 Cache-control值为“no-cache”时,访问此页面不会在Internet临时文章夹留下页面备份。
另外,通过指定“Expires”值也会影响到缓存。例如,指定Expires值为一个早已过去的时间,那么访问此网时若重复在地址栏按回车,那么每次都会重复访问: Expires: Fri, 31 Dec 1999 16:00:00 GMT 比如:禁止页面在IE中缓存 http响应消息头部设置: CacheControl = no-cache Pragma=no-cache Expires = -1 Expires是个好东东,如果服务器上的网页经常变化,就把它设置为-1,表示立即过期。
JAVA 示例
最后说下java web环境下编程,用纯servlet解决就可以
//返回图片缩略图 public class ImageThumbnailServlet extends HttpServlet { public static final int SECOND_OF_ONE_DAY = 86400; @Override protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String uniq = getSourceName(req); //根据request 计算要下载的资源的名字 contentType="image/jpeg"; String etag=getETag(uniq); //计算资源的ETag String ifNoneMatch = req.getHeader("If-None-Match"); if(ifNoneMatch!=null && etag.indexOf(ifNoneMatch)!=-1{ //ETag相同就发送 响应 304 resp.reset(); resp.setStatus(HttpServletResponse.SC_NOT_MODIFIED); return; } FileInputStream fileInputSream = getFileInputSream(uniq); //得到文件流 try { Long lastModified=getLastModified(uniq); Long expires=calcExpires(); Long maxAge=calcMaxAge(); resp.setHeader("Content-Type", contentType); resp.setHeader("Cache-Control","public,max-age="+maxAge); resp.addDateHeader("Expires", expires); resp.addDateHeader("Last-Modified",lastModified); resp.addHeader("ETag",etag); //发送流 byte[] buffer = new byte[1024]; int byteread; while ((byteread = fileInputSream.read(buffer)) != -1) { resp.getOutputStream().write(buffer, 0, byteread); } }finally { fileInputSream.close(); } } //如果请求头中包含if-modified-since,必须实现这个接口,否则出错 @Override protected long getLastModified(HttpServletRequest req) { String uniq = getSourceName(req); //根据request 计算要下载的资源的名字 return getLastModified(uniq); } ....... }
相关推荐
- `no-cache`: 这个指令并不禁止缓存,而是要求在使用缓存前先验证(通常通过`ETag`或`Last-Modified`)来确认资源是否已更新。即使缓存了响应,每次请求时仍会向服务器发送验证请求。 - `must-revalidate`: 类似...
- **Cache-Control**: 用于控制缓存行为,例如`max-age`指示资源有效期。 - **Expires**: 指定资源过期时间。 2. **协商缓存**(条件缓存):在这种模式下,即使浏览器中已经有了某个资源的副本,但在再次请求该...
本文将深入解析Apache和PHP如何通过HTTP缓存协议优化网站性能,重点探讨Cache-Control、Expires、Last-Modified以及Etag等关键头部字段的应用。 #### 一、Apache与静态页面缓存 对于Apache服务的静态页面,Last-...
HTTP协议提供了多种缓存控制策略,主要包括`Last-Modified/If-Modified-Since`和`Etag/If-None-Match`配合`Cache-Control`使用: - `Last-Modified/If-Modified-Since`:如果服务器返回的资源上次修改时间未变,...
强缓存通过检查资源的`Expires`或`Cache-Control`响应头来决定是否直接使用缓存。协商缓存则依赖于`Last-Modified`和`If-Modified-Since`或者`ETag`和`If-None-Match`头来判断资源是否已更新。 3. **临时互联网文件...
PHP中可以通过设置HTTP响应头来控制浏览器缓存行为。例如,可以使用以下代码: ```php if ($_SERVER['HTTP_IF_NONE_MATCH'] == "特定的ETag值") { header('ETag: "'.$特定的ETag值.'"', true, 304); exit(); } ...
每当用户访问一个网页,浏览器会根据HTTP响应头中的Cache-Control、Expires、ETag和Last-Modified等字段决定是否缓存资源以及缓存的有效期。例如,Cache-Control的no-cache指令告诉浏览器不要直接使用缓存,而应当向...
图片缓存策略通常包括强缓存(HTTP缓存头:Cache-Control, Expires)和协商缓存(Last-Modified, ETag)。 接着,我们谈谈“水印”。水印是一种用于标识所有权或防止图像被非法使用的图像处理技术。它可以是文字、...
- **示例**:`Cache-Control:no-cache` ##### Connection - **解释**:表示是否需要持久连接(HTTP1.1默认进行持久连接)。 - **示例**:`Connection:close` ##### Cookie - **解释**:HTTP请求发送时,会把保存在...
常见的缓存策略有强缓存(基于HTTP的Expires或Cache-Control头)和协商缓存(基于Last-Modified或ETag头),以及LRU(Least Recently Used)等空间管理策略。 在Android中,可以使用像Universal Image Loader、...
协商缓存则需要与服务器进行交互,通过`ETag`和`If-None-Match`或`Last-Modified`和`If-Modified-Since`字段来确认资源是否已更新。 **URLCache的工作原理** 1. **发起请求**:当应用程序使用URLSession发送HTTP...
Cache-Control头部用于指定资源的缓存策略,如它的最大过期时间等,而Last-Modified头部则用于告诉浏览器资源最后一次被修改的时间。 在描述中提到的“reload_into_imson”,这应该是Chinacache CDN的某个缓存控制...
- **协商缓存:** 协商缓存主要通过`ETag`和`If-None-Match`或`Last-Modified`和`If-Modified-Since`等头部来实现。 **Cache-Control**:控制缓存的行为,常见的值包括: - **no-cache**:强制客户端在使用缓存...
其中`lastModified`属性用于根据文件的最后修改时间来控制缓存,如果文件没有被修改,则返回304状态码,让浏览器使用之前的缓存数据。`etagSeed`属性则用于通过计算文件内容生成ETag(实体标签),ETag用于判断...
- Cache-Control、Expires和Pragma头可以用来控制浏览器缓存。 ```php header('Cache-Control: no-cache, no-store, must-revalidate'); header('Expires: Mon, 26 Jul 1997 05:00:00 GMT'); header('Pragma: ...