`
kavy
  • 浏览: 891149 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

网站性能优化:cache-control设置详解

    博客分类:
  • web
 
阅读更多
转自:http://www.ggseo.cn/blog/post/cache-control.html
很多与网站性能优化相关的帖子,大多只讲了应该怎么做,应该怎么设置,没有太多讲这些设置的相关解释及案例。此文重点介绍网站缓存cache-control,即哪些页面,哪些资源应该做网站缓存?并用京东的cache-control设置为案例做参考。



http响应头信息与搜索引擎蜘蛛,网站速度有着密切关系。通过设置相关头信息可以提高搜索引擎蜘蛛及用户的访问速度,提升网站有效内容的抓取量.下面重点介绍cache-control

cache-control是用于控制网页的缓存.常见的取值有private、no-cache、max-age、must- revalidate等,默认为private。

cache-control有哪些属性?



其作用根据不同的重新浏览方式分为以下几种情况:

cache-control

打开新窗口(_blank)

private、no-cache、must-revalidate 再次访问服务器
Cache-control: max-age=5(表示当访问此网页后的5秒内再次访问不 会去服务器)

在地址栏回车
值为private或must-revalidate则只有第一次访问时会访问服务器,以后就不再访问。
值为no-cache,那么每次都会访问。
值为max-age,则在过期之前不会重复访问。

按后退按扭
值为private、must-revalidate、max-age,则不会重访问,
值为no-cache,则每次都重复访问

按刷新按扭
无论为何值,都会重复访问


cache-control在哪里设置



001.gif

在IIS的网站属性中的http头信息选项卡中,勾选启用内容过期后有三个相关选项.



一、立即过期

启用此选项后,每次请求都会向服务器申请下载最新版本。浏览器不做缓存处理。状态返回码200。Cache信息是:no-cache。这种方式可以保证客户端看到的永远是最新版本,也就是说如果服务器端进行了更新,一定能被客户端看到。



二、此时段后过期与过期时间

这两种情况下,浏览器缓存将其作用。注意,第一次的状态是200,同时cache-control为30天(对应的秒数)。就是说这个网页会有30天的缓存。所以,而后的状态都会是304.



cache-control应该怎么设置更好?



对于图片,css,等长期不变化的内容应该设置较长的过期时间(如180天)

建议:

1.对于js和css可以独立到一个二级域名中,启用GZIP,且设置较长的过期时间

2.对于图片独立到另一个二级域名中,且设置较长的过期时间

对于静态文件(html)如果长期不更新也可以设置稍长的过期时间(如30天),需要根据当前网站的实际而定。

对于动态文件(php)可以设置较短的过期时间(如120秒)



注意:在过期时间内,如果您对文件内容进行了变化,对于用户或蜘蛛都不能浏览或抓取到你更改后的内容。 这也是动态文件设置较短过期时间的主要原因。cache-control的设置只是为了节约搜索引擎蜘蛛资源,让其抓取更多有效内容,千万不能弄巧成拙。



cache-control设置案例(京东)



京东的html文件大多是产品及分类页面,设置的过期时间较短



css文件不是太长,可能由于是大网站,页面变化频率更快。对于不经常变化的css完全可以设置更长的过期时间



动态文件,这是京东的新闻内容,由于是新闻的原因,可能不常更新,所以反而设置的过期时间比静态文件长



图片文件设置了很长的过期时间,如果没算错应该是120天。



有兴趣的可以仔细研究,京东的大多类型不一样的页面的过期时间都是不同的。


网页的缓存是由HTTP消息头中的“Cache-control”来控制的,常见的取值有private、no-cache、max-age、must-revalidate等,默认为private。其作用根据不同的重新浏览方式分为以下几种情况:
(1) 打开新窗口
如果指定cache-control的值为private、no-cache、must-revalidate,那么打开新窗口访问时都会重新访问服务器。而如果指定了max-age值,那么在此值内的时间里就不会重新访问服务器,例如:
Cache-control: max-age=5
表示当访问此网页后的5秒内再次访问不会去服务器
(2) 在地址栏回车
如果值为private或must-revalidate(和网上说的不一样),则只有第一次访问时会访问服务器,以后就不再访问。如果值为no-cache,那么每次都会访问。如果值为max-age,则在过期之前不会重复访问。
(3) 按后退按扭
如果值为private、must-revalidate、max-age,则不会重访问,而如果为no-cache,则每次都重复访问
(4) 按刷新按扭
无论为何值,都会重复访问

当指定Cache-control值为“no-cache”时,访问此页面不会在Internet临时文章夹留下页面备份。
另外,通过指定“Expires”值也会影响到缓存。例如,指定Expires值为一个早已过去的时间,那么访问此网时若重复在地址栏按回车,那么每次都会重复访问:
Expires: Fri, 31 Dec 1999 16:00:00 GMT

在ASP中,可以通过Response对象的Expires、ExpiresAbsolute属性控制Expires值;通过Response对象的CacheControl属性控制Cache-control的值,例如:
Response.ExpiresAbsolute = #2000-1-1# ' 指定绝对的过期时间,这个时间用的是服务器当地时间,会被自动转换为GMT时间
Response.Expires = 20  ' 指定相对的过期时间,以分钟为单位,表示从当前时间起过多少分钟过期。
Response.CacheControl = "no-cache"
Expires值是可以通过在Internet临时文件夹中查看临时文件的属性看到的。

数据包中的格式:

Cache-Control: cache-directive

cache-directive可以为以下:

request时用到:

| "no-cache"
| "no-store"
| "max-age" "=" delta-seconds
| "max-stale" [ "=" delta-seconds ]
| "min-fresh" "=" delta-seconds
| "no-transform"
| "only-if-cached"
| "cache-extension"

response时用到:

| "public"
| "private" [ "=" <"> field-name <"> ]
| "no-cache" [ "=" <"> field-name <"> ]
| "no-store"
| "no-transform"
| "must-revalidate"
| "proxy-revalidate"
| "max-age" "=" delta-seconds
| "s-maxage" "=" delta-seconds
| "cache-extension"

部分说明:

根据是否可缓存分为
Public  指示响应可被任何缓存区缓存。
Private  指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的
部分响应消息,此响应消息对于其他用户的请求无效。
no-cache  指示请求或响应消息不能缓存(HTTP/1.0用Pragma的no-cache替换)
根据什么能被缓存
no-store  用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。
根据缓存超时
max-age  指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。
min-fresh  指示客户机可以接收响应时间小于当前时间加上指定时间的响应。
max-stale  指示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以
接收超出超时期指定值之内的响应消息。
Expires 表示存在时间,允许客户端在这个时间之前不去检查(发请求),等同max-age的
效果。但是如果同时存在,则被Cache-Control的max-age覆盖。
格式:
Expires = "Expires" ":" HTTP-date
例如
Expires: Thu, 01 Dec 1994 16:00:00 GMT (必须是GMT格式)
通过HTTP的META设置expires和cache-control

Html代码
<meta http-equiv="Cache-Control" content="max-age=7200" /> 
<meta http-equiv="Expires" content="Mon, 20 Jul 2009 23:00:00 GMT" /> 
[html] view plaincopy
<meta http-equiv="<span class="hilite1">Cache-Control</span>" content="max-age=7200" /> <meta http-equiv="<span class="hilite2">Expires</span>" content="Mon, 20 Jul 2009 23:00:00 GMT" /> 
上述设置仅为举例,实际使用其一即可。这样写的话仅对该网页有效,对网页中的图片或其他请求无效,并不会做任何cache。
这样客户端的请求就多了,尽管只是检查Last-modified状态的东西,但是请求一多对浏览速度必定有影响。
如果要对文件添加cache可以通过apache的mod_expire模块,写法为
<IfModule mod_expires.c>
ExpiresActive On
ExpiresDefault "access plus 1 days"
</IfModule>
记得ExpiresActive设为On,我起先没设置On,似乎怎样YSlow都查不到缓存机制。这样添加的话就是默认所有的。
如果要针对个别MIME类型则可以:
ExpiresByType image/gif "access plus 5 hours 3 minutes"
见 Apache Module mod_expires
另外,当点击浏览器上的刷新,客户端发送的请求中均是max-age=0,表示validate操作,发送请求到服务器
要求检查cache,再更新cache,一般得到的是304 Not Modified,表示没变动。
项目中使用过滤器来设置网页的缓存

FilterConfig fc;

    public void doFilter(ServletRequest req, ServletResponse res,
            FilterChain chain) throws IOException, ServletException {
        HttpServletResponse response = (HttpServletResponse) res;
        // set the provided HTTP response parameters
        for (Enumeration e = fc.getInitParameterNames(); e.hasMoreElements();) {
            String headerName = (String) e.nextElement();
            response.addHeader(headerName, fc.getInitParameter(headerName));
        }
        // pass the request/response on
        chain.doFilter(req, response);
    }

配置文件的配置:
<filter>
        <filter-name>NoCache</filter-name>
        <filter-class>filter.CacheFilter</filter-class>
        <init-param>
            <param-name>Cache-Control</param-name>
            <param-value>no-cache, must-revalidate</param-value>
        </init-param>
    </filter>
    <filter>
        <filter-name>CacheForWeek</filter-name>
        <filter-class>filter.CacheFilter</filter-class>
        <init-param>
            <param-name>Cache-Control</param-name>
            <param-value>max-age=604800</param-value>
        </init-param>
    </filter>

    <filter-mapping>
        <filter-name>CacheForWeek</filter-name>
        <url-pattern>*.js</url-pattern>
    </filter-mapping>
    <filter-mapping>
        <filter-name>CacheForWeek</filter-name>
        <url-pattern>*.css</url-pattern>
    </filter-mapping>
    <filter-mapping>
        <filter-name>CacheForWeek</filter-name>
        <url-pattern>*.gif</url-pattern>
    </filter-mapping>

上述设置保存了1周的缓存
分享到:
评论

相关推荐

    Cache-control使用Cache-control:private学习笔记

    **HTTP缓存控制:Cache-Control详解** 在HTTP协议中,Cache-Control头字段是用于管理缓存行为的关键机制,它允许服务器指示客户端如何缓存响应内容。`Cache-Control`字段可以接受多种指令,以控制网页的缓存策略。...

    http头部cache-control字段解析

    在HTTP响应中,`Cache-Control`可以用来优化网站性能,减少延迟,降低服务器负载。在HTTP请求中,它允许客户端控制缓存策略,比如强制刷新页面,避免使用过时的缓存数据。 四、案例分析 例如,一个静态资源文件如...

    http cache-control详解

    理解并正确使用`Cache-Control`对于优化网站性能至关重要。 1. **`Cache-Control`的基本用法** - `private`: 此值表明响应只适用于单个用户,不允许共享缓存。这意味着代理服务器不能缓存该资源,只能存储在用户的...

    nginx缓存不起作用问题解决方法

    header主要有如下: 代码如下:Cache-control:no-cache、no-store如果出现这两值,nginx缓存服务器是绝对不会缓存的 代码如下:Expires:1980-01-01如果出现日期比当前时间早,也不会缓存。 2. 解决不缓存方案 2.1 ...

    为何要小心Nginx的add_header指令详解

    前言 大家都知道,nginx配置文件通过使用add_header指令来设置response header。 昨天无聊用curl查看一个站点的...cache-control: max-age=3, must-revalidate last-modified: Thu, 07 Feb 2019 03:54:54 GMT X-Cach

    Nginx配置跨域请求Access-Control-Allow-Origin * 详解

    3. `Access-Control-Allow-Headers 'DNT,X-Mx-ReqToken,Keep-Alive,User-Agent,X-Requested-With,If-Modified-Since,Cache-Control,Content-Type,Authorization'`:设置允许的请求头,防止因特定请求头未被服务器...

    response.setHeader问题

    response.setHeader 问题详解 Response.setHeader 问题是指在 Servlet 中使用 response 对象的 setHeader 方法来设置...通过设置 Cache-Control、Pragma 和 Expires 报头,可以禁用浏览器的缓存,提高页面的响应速度。

    MD使用资源

    ### DELL 存储配置与管理详解 #### 一、MD Storage管理工具概述 MD Storage是DELL提供的一套高效且灵活的存储解决方案,适用于多种规模的企业环境。为了更好地管理和维护存储系统,DELL提供了几种不同的管理工具,...

    Http基础.doc

    在这个请求中,`GET`方法用于获取指定的资源(`somedata.exe`),`Host`指明了请求的服务器,`Accept`表示接受任何类型的数据,`Pragma: no-cache`和`Cache-Control: no-cache`共同作用于禁用缓存,`Referer`表明了...

    如何防止IE缓存jsp文件.doc

    - `&lt;META HTTP-EQUIV="Cache-Control" CONTENT="no-cache"&gt;`:等同于设置了`Cache-Control`响应头。 - `&lt;META HTTP-EQUIV="Expires" CONTENT="0"&gt;`:与设置了`Expires`响应头相同。 ### 实现原理及注意事项 1. **...

    HTTP协议的头信息详解.pdf

    Cache-Control 头域可以设置缓存指令,例如 no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached 等。 * Date 头域:表示消息发送的时间,时间的描述格式由 rfc822 定义。 * Pragma 头域:用来包含...

    web浏览器-缓存详解

    本文将深入解析浏览器缓存的工作原理、类型、以及如何控制和利用缓存来优化网站性能。 一、浏览器缓存的原理 浏览器缓存(Browser Cache)是一种本地存储机制,它会保存用户访问过的网页资源(如HTML、CSS、...

    HTTP协议的Header头信息详解.txt

    Cache-Control: no-cache Referer: http://download.microtool.de/ User-Agent: Mozilla/4.04 [en] (Win95; I; Nav) Range: bytes=554554- ``` 这段请求包含了多个Header头信息,如`Host`、`Accept`、`Cache-...

    PHP禁止缓存如何禁止页面缓存

    在Web开发中,页面缓存是提高网站性能的重要手段之一。但是,在某些情况下,为了确保用户看到的是最新的数据或页面状态,我们需要禁用页面缓存。本文将详细介绍如何通过PHP代码来实现页面缓存的禁止。 #### 一、...

    HTTP 请求报头详解

    * General Header Fields: Cache-Control、Connection、Date、Pragma、Trailer、Transfer-Encoding、Upgrade、Via、Warning * Request Header Fields:Accept、Accept-Charset、Accept-Encoding、Accept-Language、...

    http协议 heat response.docx

    ### HTTP协议中的请求与响应详解 ...它采用了一种基于请求/响应的通信模型,客户端(如浏览器)发起请求,服务器接收并...通过了解这些字段的功能和使用场景,可以更好地理解HTTP通信过程,并有助于优化网络应用的性能。

    HTTP协议的头信息详解

    它基于请求/响应模型,客户端...理解并熟练运用这些HTTP头信息对于Web开发、网络调试、性能优化等都是非常关键的。开发者可以通过控制头信息来实现缓存控制、身份验证、数据压缩等高级功能,提升用户体验和系统效率。

    HTTP协议头详解

    在请求消息或响应消息中设置 Cache-Control 并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令包括 no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached,响应消息中的指令包括 ...

    浏览器HTTP缓存机制

    当同时设置了`Expires`和`Cache-Control`时,后者具有更高的优先级。常用的值包括: - `no-cache`: 表明资源不能被缓存。 - `max-age=&lt;seconds&gt;`: 定义资源在浏览器中的最大有效期(以秒为单位)。 ##### 验证...

    HTTP消息头详解.docx

    - 示例:`Cache-Control: max-age=3600` 以上介绍的是HTTP消息头中较为常用的部分。通过理解这些消息头的意义和作用,可以帮助开发者更有效地管理和控制HTTP通信过程中的各种细节。在实际开发过程中,正确设置和...

Global site tag (gtag.js) - Google Analytics