`

HTTP协议缓存策略深入详解之etag妙用

阅读更多

一.Etag是什么

        Etag 是URL的Entity Tag,用于标示URL对象是否改变,区分不同语言和Session等等。具体内部含义是使服务器控制的,就像Cookie那样。

        HTTP协议规格说明定义ETag为“被请求变量的实体值” 。另一种说法是,ETag是一个可以与Web资源关联的记号(token)。典型的Web资源可以一个Web页,但也可能是JSON或XML文档。服务器单独负责判断记号是什么及其含义,并在HTTP响应头中将其传送到客户端。

 

二.实例详解

        也许读者们看完这个概念,还是搞不清楚这个etag响应头消息到底是干什么的,具体如何使用,所以接下来的篇幅我会用一个实际的例子来详细阐述etag的妙用。

        想必许多网友都有订阅某些大虾的RSS的习惯吧,但是大虾也是人,也要吃饭睡觉打豆豆,所以不可能无时无刻的在从事文学创作,因此一般产量较高的大虾也许平均每天能更新两篇已经是不错了,但是网友们却总是不断的去刷新RSS订阅的内容,期望在下次刷新中又有新的劲爆文章出现,如果我们每次刷新,都要从服务器端重新获取内容(事实上,几乎一天内95%以上的刷新返回的都是相同内容,因为刚才也说了,大虾一般一天也就出一两篇新文章而已,所以大部分时间内,内容都是相同的),如果订阅量相当巨大,这对于服务器的压力还是带宽都是一个严重的挑战。其实真正需要服务器重新返回内容是大虾们更新了新的文章后,而其他时间我们无论怎么刷新服务器最好能做到不需返回任何数据,这才是一个比较好的方案,而我们的主角etag响应头的出现正是为了解决这个问题。

 

三.浏览器端实现

        当我们订阅了某大虾的RSS,如图,我们点击左下角“RSS”按钮:


        然后我们进入了rss订阅的相关页面,此时我们打开tamper data(类似FireBug)查看下http请求和响应内容。如下图:


        从上图我们可以看到,服务器端返回响应值为200,并发送回了相应的网页内容,在http响应头中有etag消息头,值为Etag="fca75d26f6dc8111a7d1b24e9debd652",我们不需要去关心这个响应头的内容是什么,我们只需要将这这个头信息的值记录下来,随便创建一个notepad之类的东西保存好,以备接下来的实验使用。

        然后我们刷新,希望能从webserver端获取该大虾新的文章,这时候我们用tamper data查看下http头中有哪些内容,如下图:


        从此图中我们可以看到If-None-Match="fca75d26f6dc8111a7d1b24e9debd652",而该值的内容和我们先前第一次刷新返回的http响应中的etag响应头的值完全一样。

        如果某大虾并没在这段时间内发表任何文章,于是webserver端的rss文件没有任何变化,于是If-None-Match值和server端的etag值相比较完全相等,这时候服务器就会认为客户端已经有最新的rss文件内容的缓存了,于是服务器就会发送一个 响应码为“304”的http响应,304响应想必大家都知道是什么意思了,没错,他不包含任何响应的内容,只是提示客户端缓存的内容是最新的,如下图。


        如果某大虾刚发表了一篇新的文章,因此在webserver中的rss的内容发生了改变,因此他的etag值就会发生改变,于是服务器会拿http请求中的If-None-Match的值和改变和的etag值做对比,显然不正确的,于是webserver就会发送一个新的rss内容给客户端,这里我不能强制要求某大虾来配合我们的实验去立马发表新文章,所以我们就变相做,也就是我们故意修改http请求头中的If-None-Match的值,这样就和服务器端的etag就不会匹配了,显然这时候服务器就会受骗发送一份“新”的rss内容回来,如下图:


        这里我们将http请求中的If-None-Match的值改为了"modifiedForOurTest", 显然与响应中的Etag="fca75d26f6dc8111a7d1b24e9debd652"不同,因此服务器就被受骗认为浏览器没有最新的文件内容,于是就返回了全新的响应内容(状态码200),而事实上浏览器端是有最新的内容的缓存的。

 

文章来源:http://www.iteye.com/topic/656658

  • 大小: 38.4 KB
  • 大小: 99.6 KB
  • 大小: 29.3 KB
  • 大小: 21 KB
  • 大小: 85.8 KB
分享到:
评论

相关推荐

    张孝祥_HTTP协议详解第四讲

    在本课程"张孝祥_HTTP协议详解第四讲"中,我们深入探讨了HTTP(超文本传输协议)这一互联网上应用最为广泛的一种网络协议。张孝祥老师,作为传智播客的一位资深讲师,以其丰富的教学经验和专业技能,为我们详细剖析...

    HTTP协议详解.rar

    通过Cache-Control、ETag、If-None-Match等首部字段来控制缓存策略。 10. **持久连接**:HTTP/1.1默认使用持久连接,允许在一个TCP连接上多次发送请求和响应,减少了建立和关闭连接的开销。 以上只是HTTP协议基础...

    Java Web_HTTP协议详解第二讲

    在本课程"Java Web_HTTP协议详解第二讲"中,我们将深入探讨HTTP(超文本传输协议)在Java Web开发中的应用和重要性。HTTP是互联网上应用最广泛的一种网络协议,它是客户端(如Web浏览器)与服务器之间进行通信的基础...

    web浏览器-缓存详解

    1. HTTP缓存:基于HTTP协议的缓存机制,主要通过HTTP响应头中的Cache-Control、Expires、ETag、Last-Modified等字段来控制缓存行为。 - Cache-Control:用于设置缓存策略,如max-age指示资源的有效期,no-cache则...

    http协议HttpWatch文档

    HttpWatch分析缓存行为,包括是否从缓存中获取资源、缓存控制策略等,有助于优化网站的缓存策略,提高页面加载速度。 总的来说,HttpWatch是HTTP协议分析的强大工具,它提供了深入的性能数据和诊断功能,对于开发者...

    彻底理解浏览器的缓存机制.docx

    为了提升用户体验并减轻服务器压力,浏览器通过一系列的缓存策略来加速页面加载速度。浏览器缓存机制是基于HTTP协议实现的,它通过缓存标识来判断请求的数据是否可以被重用,从而避免了不必要的网络传输。 #### 二...

    web页面缓存可用.pdf

    然而,这种缓存策略并不完美,因为它忽略了服务器端的缓存控制策略(如HTTP头中的Cache-Control或ETag),可能导致缓存数据不准确。在实际应用中,可以考虑结合HTTP标准的缓存策略,或者使用更高级的缓存框架(如...

    http

    HTTP支持客户端缓存,通过`Cache-Control`和`ETag`等头部字段控制缓存策略,减少不必要的网络请求,提高性能。 9. **HTTP代理与反向代理**: 代理服务器可以转发客户端的HTTP请求,用于访问受限资源或优化网络...

    HTTP1.0&HTTP1.1(rfc2616)

    8. **缓存控制**:通过Cache-Control头部提供了更精确的缓存策略控制。 9. **更多头部字段**:增加了ETag、If-Match、If-Unmodified-Since等,增强了请求和响应的灵活性和可靠性。 ### TCP/IP详解卷二 TCP/IP详解...

    httpclient cache 4.2

    缓存策略根据服务器返回的响应头动态调整,可以有效减少重复请求,提高性能。 3. 缓存配置与使用 用户可以通过设置`HttpRequestExecutor`和`HttpRoutePlanner`来控制缓存行为。例如,可以配置`CacheConfig`对象来...

    http 两件套

    5. 缓存机制:HTTP缓存策略,如Cache-Control、ETag和If-Modified-Since等头字段的使用。 6. HTTP/1.1与HTTP/2的区别:比较新旧版本的改进,如多路复用、头部压缩和优先级树等特性。 接下来,我们转向"Lighttpd源码...

    httpHeader详解

    - `Cache-Control`: 控制缓存策略,如`max-age`指示资源的有效期。 3. **实体头(Entity Headers)**:这些头与请求或响应的实体主体有关: - `Content-Encoding`: 编码方式,如gzip或deflate用于压缩传输。 - `...

    http_base.zip

    9. **HTTP缓存机制**:通过Last-Modified和ETag头部,HTTP支持缓存策略,减少不必要的网络传输,提高页面加载速度。 10. **跨域资源共享(CORS)**:CORS是现代Web应用解决跨域问题的一种机制,通过特定的HTTP头部...

    HTTP_权威指南

    - **协商缓存**:利用条件GET请求和ETag/Last-Modified等头来判断缓存是否有效。 #### 七、HTTP与其他技术的交互 - **RESTful API**:基于HTTP的API设计风格,强调资源的表述性。 - **WebSocket**:实现实时双向...

    Http请求头和响应头

    在互联网世界中,HTTP(超文本传输协议...通过阅读《Http请求头和响应头.pdf》和《http 头信息详解.pdf》这样的资料,你可以深入学习这些概念,进一步提升你的HTTP知识和技能,从而在开发和维护Web应用时更加得心应手。

    HTTP指南(目录版)

    1. **缓存机制**:探讨HTTP缓存策略,如强缓存和协商缓存,以及如何通过Cache-Control和ETag实现。 2. **持久连接**:介绍Keep-Alive和HTTP/2的多路复用技术,减少网络延迟。 **四、安全与HTTPS** 1. **HTTPS**:...

    A web caching primer

    3. **缓存策略**:根据不同的应用场景选择合适的缓存策略至关重要。例如,可以根据内容类型(如静态资源与动态内容)、请求频率等因素来决定是否进行缓存以及如何更新缓存。 4. **一致性问题**:缓存中存储的数据...

    浏览器源码

    2. **资源缓存**:浏览器使用HTTP缓存策略,如Last-Modified和ETag,以及Service Worker来缓存资源,减少网络请求。 3. **首屏优化**:通过延迟加载非首屏内容、优化CSS选择器、压缩图片等方式,提高首屏渲染速度。...

    河北光纤通信服务中心WAP1.2源码

    7. **缓存管理**:源码可能还涉及到缓存策略,如HTTP的ETag和Last-Modified头,以减少不必要的网络通信,提高响应速度。 通过对“河北光纤通信服务中心WAP1.2源码”的理解和分析,开发者不仅可以了解如何构建一个...

    web系统性能优化[参照].pdf

    6. 利用缓存:设置合适的缓存策略,如ETag和Last-Modified头,让浏览器缓存静态资源,减少重复请求。 7. 图像优化:压缩图片,选择合适的文件格式(如WebP),可以大幅度减少页面大小,提高加载速度。 综上所述,...

Global site tag (gtag.js) - Google Analytics