`

关于浏览器缓存的控制cache-control,expires,last-modified,etag,及编程示例

阅读更多

原理

       浏览器的缓存的意义在于减少网络流量,为了达到这个目的,采用了两个手段

 1、减少客户端对服务器的请求

       解决方案是:为每个资源设置一个有效期限。

       在客户端取得资源后,缓存在本地,一段时间内,如果再次展示这个资源时,不再向服务器发出请求,而是直接取缓存的内容。

       相对应的编程手段就是

          1. 在Htpp的Header中指定Cache-Control:max-age=xxx(秒)

          2. 或 Expires= Tue, 28 Apr 2015 15:50:47 GMT (这里必须是GMT时间)

        以上这两者都存在时,Cache-Control 优先。

 2、服务器不传输重复的内容

       解决方案是:服务器为每个资源打上一个标记(或时间戳)。

       这些标记会连同资源一起发送给客户端,客户端在请求时,如果缓存中已经有这个资源,就把这些标记发回给服务器,服务器根据这些标记判断是否重新发送。相对应的编程手段是

          A. Htpp的Header中指定Last-Modified / If-Modified-Since ,服务端发送资源是带上Last-Modified,客户端请求时带上If-Modified-Since,服务端判断到资源未变时,响应 304 状态码。这两个也都是GMT 时间格式

          B Htpp的Header中指定 ETag / If-None-Match ,服务端发送资源是带上ETag ,客户端请求时带上If-None-Match,服务端判断到资源未变时,响应 304 状态码。ETag 通常可以对资源计算MD5码后得到。

 

其它设置

          有些资源不适合用缓存,比如动态的数据,或者涉及安全的数据,所以Cache-Control 还有几个策略值:

          no-cache: 不缓存,客户端每次都要重新请求资源。

          Public :可以在代理服务器上缓存(比如客户的ISP上建立的代理服务器)

          Private :只能在客户端缓存,代理服务器不能缓存

          no-store :不保存到文件中

         

         另外还有些不常见的Cach-Control的设置,比如

         min-refresh: 在不到max-age时就去请求新资源

         max-stale  :  能够接受过期的内容

         另外,还有些涉及到代理服务器,CDN 如何更新缓存内容的一些策略控制。详细的内容可参考 http://tools.ietf.org/html/rfc2616#section-14.9 。

 

浏览器对缓存的处理

           浏览器根据以上的设置,以有用户操作,来决定缓存的处理方式:

       

           1) 打开新窗口 值为private、no-cache、must-revalidate,那么打开新窗口访问时都会重新访问服务器。 而如果指定了max-age值,那么在此值内的时间里就不会重新访问服务器,例如: Cache-control: max-age=5(表示当访问此网页后的5秒内再次访问不会去服务器)

            2) 在地址栏回车 值为private或must-revalidate则只有第一次访问时会访问服务器,以后就不再访问。 值为no-cache,那么每次都会访问。 值为max-age,则在过期之前不会重复访问。

            3) 按后退按扭 值为private、must-revalidate、max-age,则不会重访问, 值为no-cache,则每次都重复访问

            4) 按刷新按扭 无论为何值,都会重复访问 Cache-control值为“no-cache”时,访问此页面不会在Internet临时文章夹留下页面备份。

           另外,通过指定“Expires”值也会影响到缓存。例如,指定Expires值为一个早已过去的时间,那么访问此网时若重复在地址栏按回车,那么每次都会重复访问: Expires: Fri, 31 Dec 1999 16:00:00 GMT 比如:禁止页面在IE中缓存 http响应消息头部设置: CacheControl = no-cache Pragma=no-cache Expires = -1 Expires是个好东东,如果服务器上的网页经常变化,就把它设置为-1,表示立即过期。  

 

JAVA 示例         

         最后说下java web环境下编程,用纯servlet解决就可以

//返回图片缩略图
public class ImageThumbnailServlet extends HttpServlet {

    public static final int SECOND_OF_ONE_DAY = 86400;

    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        String uniq = getSourceName(req); //根据request 计算要下载的资源的名字
        contentType="image/jpeg";


        String etag=getETag(uniq);  //计算资源的ETag
        String ifNoneMatch = req.getHeader("If-None-Match");
        if(ifNoneMatch!=null && etag.indexOf(ifNoneMatch)!=-1{  //ETag相同就发送 响应 304
                resp.reset();
                resp.setStatus(HttpServletResponse.SC_NOT_MODIFIED);
                return;
        }

        FileInputStream fileInputSream = getFileInputSream(uniq); //得到文件流
        try {
            Long lastModified=getLastModified(uniq);
            Long expires=calcExpires();
            Long maxAge=calcMaxAge();
            resp.setHeader("Content-Type", contentType);
            resp.setHeader("Cache-Control","public,max-age="+maxAge);
            resp.addDateHeader("Expires", expires);
            resp.addDateHeader("Last-Modified",lastModified);
            resp.addHeader("ETag",etag);

            //发送流
            byte[] buffer = new byte[1024];
            int byteread;
            while ((byteread = fileInputSream.read(buffer)) != -1) {
                resp.getOutputStream().write(buffer, 0, byteread);
            }
        }finally {
            fileInputSream.close();
        }
    }

    //如果请求头中包含if-modified-since,必须实现这个接口,否则出错
    @Override
    protected long getLastModified(HttpServletRequest req) {
         String uniq = getSourceName(req); //根据request 计算要下载的资源的名字
         return getLastModified(uniq);
    }

    .......
}

 

 

 

 

分享到:
评论

相关推荐

    http cache-control详解

    - `no-cache`: 这个指令并不禁止缓存,而是要求在使用缓存前先验证(通常通过`ETag`或`Last-Modified`)来确认资源是否已更新。即使缓存了响应,每次请求时仍会向服务器发送验证请求。 - `must-revalidate`: 类似...

    浏览器之HTTP缓存的那些事

    - **Cache-Control**: 用于控制缓存行为,例如`max-age`指示资源有效期。 - **Expires**: 指定资源过期时间。 2. **协商缓存**(条件缓存):在这种模式下,即使浏览器中已经有了某个资源的副本,但在再次请求该...

    Apache PHP利用HTTP缓存协议原理解析及应用

    本文将深入解析Apache和PHP如何通过HTTP缓存协议优化网站性能,重点探讨Cache-Control、Expires、Last-Modified以及Etag等关键头部字段的应用。 #### 一、Apache与静态页面缓存 对于Apache服务的静态页面,Last-...

    Nginx与浏览器缓存的处理方法

    HTTP协议提供了多种缓存控制策略,主要包括`Last-Modified/If-Modified-Since`和`Etag/If-None-Match`配合`Cache-Control`使用: - `Last-Modified/If-Modified-Since`:如果服务器返回的资源上次修改时间未变,...

    浏览器页面-暂存.zip

    强缓存通过检查资源的`Expires`或`Cache-Control`响应头来决定是否直接使用缓存。协商缓存则依赖于`Last-Modified`和`If-Modified-Since`或者`ETag`和`If-None-Match`头来判断资源是否已更新。 3. **临时互联网文件...

    深入PHP与浏览器缓存的分析

    PHP中可以通过设置HTTP响应头来控制浏览器缓存行为。例如,可以使用以下代码: ```php if ($_SERVER['HTTP_IF_NONE_MATCH'] == "特定的ETag值") { header('ETag: "'.$特定的ETag值.'"', true, 304); exit(); } ...

    web 缓存

    每当用户访问一个网页,浏览器会根据HTTP响应头中的Cache-Control、Expires、ETag和Last-Modified等字段决定是否缓存资源以及缓存的有效期。例如,Cache-Control的no-cache指令告诉浏览器不要直接使用缓存,而应当向...

    图片缓存和水印

    图片缓存策略通常包括强缓存(HTTP缓存头:Cache-Control, Expires)和协商缓存(Last-Modified, ETag)。 接着,我们谈谈“水印”。水印是一种用于标识所有权或防止图像被非法使用的图像处理技术。它可以是文字、...

    http协议 heat response.docx

    - **示例**:`Cache-Control:no-cache` ##### Connection - **解释**:表示是否需要持久连接(HTTP1.1默认进行持久连接)。 - **示例**:`Connection:close` ##### Cookie - **解释**:HTTP请求发送时,会把保存在...

    关于 图片 缓存 下载

    常见的缓存策略有强缓存(基于HTTP的Expires或Cache-Control头)和协商缓存(基于Last-Modified或ETag头),以及LRU(Least Recently Used)等空间管理策略。 在Android中,可以使用像Universal Image Loader、...

    URLCache.zip_URLCache_apple sdk_caching

    协商缓存则需要与服务器进行交互,通过`ETag`和`If-None-Match`或`Last-Modified`和`If-Modified-Since`字段来确认资源是否已更新。 **URLCache的工作原理** 1. **发起请求**:当应用程序使用URLSession发送HTTP...

    PHP 网页过期时间的控制代码

    Cache-Control头部用于指定资源的缓存策略,如它的最大过期时间等,而Last-Modified头部则用于告诉浏览器资源最后一次被修改的时间。 在描述中提到的“reload_into_imson”,这应该是Chinacache CDN的某个缓存控制...

    http 从入门到精通

    - **协商缓存:** 协商缓存主要通过`ETag`和`If-None-Match`或`Last-Modified`和`If-Modified-Since`等头部来实现。 **Cache-Control**:控制缓存的行为,常见的值包括: - **no-cache**:强制客户端在使用缓存...

    YII框架http缓存操作示例

    其中`lastModified`属性用于根据文件的最后修改时间来控制缓存,如果文件没有被修改,则返回304状态码,让浏览器使用之前的缓存数据。`etagSeed`属性则用于通过计算文件内容生成ETag(实体标签),ETag用于判断...

    php header函数的常用http头设置

    - Cache-Control、Expires和Pragma头可以用来控制浏览器缓存。 ```php header('Cache-Control: no-cache, no-store, must-revalidate'); header('Expires: Mon, 26 Jul 1997 05:00:00 GMT'); header('Pragma: ...

Global site tag (gtag.js) - Google Analytics