`
44424742
  • 浏览: 232501 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

web开发中的缓存问题的研究

阅读更多

一般情况下,浏览器都会缓存已经访问过的页面内容,关于如何禁止浏览器缓存的介绍,在网上到处都有相关的文章,但是,关于浏览器如何利用缓存,如何处理缓存的讲解,却鲜有人谈及.我一直为这个问题所困惑,这个问题也是绝大多数有经验的WEB开发人员所共同面临的问题,我有些朋友已做过几十个大大小小的WEB项目,当与他们交流这些问题时,他们虽然也在项目中遇到和解决过这些问题,但由于没有足够的时间和精力来仔细思考这些问题的原因和细节,他们对这些问题始终也是一知半解、含糊不清,而目前又很少关于这些问题的专门和详细讲解,我最近用了两天的时间,把浏览器缓存的问题透彻地研究了一翻,主要包括一下方面的细节.

1.如何禁止浏览器缓存,这是最简单的问题,本来羞于在此讲解,但是为了完整性,不妨将其列为一个知识点.

2.浏览器在访问已缓存过的资源时,它在什么情况下会向服务器发送请求?在什么情况下根本就不向服务器发送请求.这与浏览器的缓存设置有关!但是,由于几乎所有人的浏览器都是采用的默认设置,所以,重点应该放在分析浏览器的默认缓存设置的研究上.

3.当通过其他网页文档中的超链接来访问某一个已经缓存过的资源时,浏览器是否要向服务器发出访问请求?如果不发,则会出现一个问题:当销售一件商品后再回到商品库存的显示页面时,看到的还将是先前看到的内容,而不是更新的库存数据。但是,在访问一个普通的HTML文件时,如果浏览器每次都向服务器发送访问请求,效率就会相对低下,这就失去了缓存的意义和价值.所以,结论应是浏览器访问动态页面时不能使用缓存,而访问静态页面时应该使用缓存,但是,仅仅根据被访问页面的资源名称,浏览器是无法知道商品库存的显示页面是属于动态内容,还是属于静态内容。浏览器是根据什么方式来判断它缓存的资源是动态的,还是静态的呢?在什么请求下,它会对缓存的资源总是发出新的请求呢?

4.对于缓存的内容,即使浏览器向服务器发送了请求,但服务器在接收到请求后,可能不会返回内容,而是让浏览器继续使用缓存的内容,这在实际应用中有什么好处呢?如何处理其具体细节呢?

5.服务器端也有缓存,当服务器接收到浏览器的请求后,假设它返回响应内容,但返回的响应内容可能不是最新的内容,而很可能是一个旧的缓存版本,这又是怎么回事呢?

所有这些问题,在笔者的《深入体验java web开发内幕》一书中都有深刻的分析和详细的实验步骤.

以下是该书的节选(不包括服务器端缓存技术的讲解,服务器端缓存技术在其他章节有案例分析)

4.5.8 浏览器缓存内幕与getLastModified方法
在HttpServlet类中定义了一个getLastModified方法,其完整语法定义如下:
protected long getLastModified(HttpServletRequest req)
其中的返回值表示自1970年1月1日的0点0分0秒开始计算的一个毫秒数,HttpServlet类中定义的getLastModified方法总是返回一个负数,在HttpServlet子类中可以对这个方法进行覆盖,以便返回一个代表当前输出的响应内容的修改时间,HttpServlet类的service方法可以根据这个返回值在响应消息中自动生成Last-Modified头字段。
一般情况下,浏览器都会缓存已经访问过的页面内容,getLastModified方法的返回值可以影响浏览器如何处理和利用缓存内容。在详细了解getLastModified方法的应用之前,应该先对浏览器的缓存机制有所了解。单击IE浏览器的“工具”“Internet选项”菜单,打开“Internet选项”对话框,接着再单击“常规”选项卡中的“Internet临时文件”栏中的“设置”按钮,打开如图4.16所示的“设置”对话框

还可以看到,其“检查所存网页的较新版本”功能项的设置值有4个选项,只要先单击“设置”对话框标题栏中的问号按钮,然后再单击相应的选项,就可以看到每个选项的作用和意义:

“每次访问此页时检查”选项表示浏览器每次访问一个页面时,不管浏览器是否缓存过此页面,都要向服务器发出访问请求。这种设置的优点是实时性很强,肯定能够访问到网页的最新内容,但是如果网页内容很少更新,这种设置的访问效率就比较低了。
“每次启动Internet Explorer时检查”选项表示在浏览器的每次启动运行期间,在第一次访问一个页面时,不管浏览器是否缓存过此页面,都要向服务器发出访问请求,但是在浏览器的本次启动运行期间对该页面的后续访问,浏览器将不再向服务器发出访问请求,而是直接使用缓存中的内容。这种设置具有较高的访问效率,同时也兼顾了较好的实时性,它可以保证每次启动浏览器后看到的都是最新的网页内容。
“自动”选项与“每次启动Internet Explorer时检查”选项的功能相似,只是对图像的访问有所不同,如果随着时间的推移,浏览器发现网页上的图像更新并不频繁,这样,即使浏览器在对某个已缓存的图像执行本次启动运行以来的第一次访问时,它也不一定会向服务器发出访问请求,而是干脆直接使用缓存中的内容。“自动”选项是浏览器的默认设置,所以,几乎所有人的浏览器都是按照这种方式工作的,这个选项的作用和意义应该成为读者熟悉的重点。
“不检查”选项表示浏览器不管在什么情况下访问一个页面时,只要能够在本地找到此页面的缓存信息,浏览器就不会向服务器发出访问请求,而是直接使用缓存的内容。这种设置的优点是访问效率很高,但是如果服务器端的网页内容更新后,浏览器看到的内容很可能是过期的内容。
在浏览器的“检查所存网页的较新版本”的功能项采用默认的“自动”设置项的情况下,如果浏览器刚刚访问过一个网页,服务器端就更新了这个网页的内容,当浏览在关闭前又重新访问这个页面时,用户看到的将不是更新的网页内容,而是过期的网页内容。为了提高浏览效率,在访问静态的网页内容时,这么一点小概率的过期信息还是应该允许的,并且这些过期信息也不会造成什么不好的后果,就像你偶尔有一次看到了前一天发生的新闻,而不是当天的新闻,这又有什么问题呢?可是,如果浏览器访问的是一个动态网页,这本来就要求浏览器在其整个运行期间的每次访问都能看到最新的内容,例如,销售一件商品后再回到商品库存的显示页面时,看到的就应该是更新的库存数据,而不应该是先前看到的内容。仅仅根据被访问页面的资源名称,浏览器是无法知道商品库存的显示页面是属于动态内容,还是属于静态内容。对于这种情况,浏览器将根据响应消息中是否包含Last-Modified头字段来进行处理,如果响应消息中没有包含Last-Modified头字段,它将在每次访问此页面时都向服务器发出访问请求,否则,它仅在每次启动运行后的第一次访问此页面时才向服务器发出访问请求,而在启动运行期间对此页面的后续访问都不再向服务器发出访问请求。
在第2章中曾经讲解过,响应消息中的Last-Modified头字段可用于指定响应内容的最后更新时间,当客户机缓存此文档内容后,它在以后的请求消息中将根据Last-Modified头字段指定的时间来生成If-Modified-Since请求头字段,以指出缓存文档的最后更新时间。只有文档的修改时间比If-Modified-Since请求头指定的时间新时,服务器才会返回文档内容。如果自从If-Modified-Since指定的时间以来,网页内容没有发生修改,服务器将返回一个304(Not Modified)状态码来表示浏览器缓存的版本是最新的,而不会向浏览器返回文档内容,浏览器则继续使用以前缓存的内容。通过这种方式,可以在一定程度上减少浏览器与服务器之间的通信数据量,从而提高了通信效率。
HttpServlet类为If-Modified-Since请求头和Last-Modified头字段的这种应用提供了处理机制,当继承了HttpServlet类的Servlet程序接收到一个GET方式的访问请求时,HttpServlet中重载的service方法在调用doGet方法之前,它还将调用getLastModified方法,并根据getLastModified方法的返回值来决定是否调用doGet方法和在响应消息中是否生成Last-Modified头字段,具体规则如下:

当getLastModified方法返回一个负数时,不管请求消息中的情况怎样,service方法都将直接调用doGet方法来生成响应内容,这正是HTTPServlet类中定义的getLastModified方法的行为;
当getLastModified方法返回一个正数,且请求消息中没有包含If-Modified-Since请求头时(这往往出现在第对某个资源的第一次访问时),或者请求消息中包含的If-Modified-Since请求头中的时间值比getLastModified方法返回的时间值旧时,service方法将根据getLastModified方法的返回值生成一个Last-Modified头字段,然后调用doGet方法生成响应内容;
当getLastModified方法返回一个正数时,且请求消息中包含的If-Modified-Since请求头中的时间值比getLastModified方法返回的时间值新或者与之相同时,service方法将不调用doGet方法,而是向浏览器返回一个304(Not Modified)状态码表示浏览器可以使用其以前缓存的内容。
动手体验:揭开浏览器缓存的奥秘
(1)编写一个名为CacheServlet的Servlet程序,在其doGet方法中向浏览器和Tomcat的命令行窗口中都打印出当前的时间值,getLastModified方法也是向Tomcat的命令行窗口中打印出当前的时间值和返回当前时间值,这里先将getLastModified方法注释掉,如例程4-9所示。

例程4-9 CacheServlet.java

import java.io.*;
import javax.servlet.*;
import javax.servlet.http.*;

public class CacheServlet extends HttpServlet
{
public void doGet(HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException
{
PrintWriter out = response.getWriter();
long now = System.currentTimeMillis();
out.println("doGet:" + now);
System.out.println("doGet:" + now);
}

/*protected long getLastModified(HttpServletRequest req)
{
long now = System.currentTimeMillis();
System.out.println("getLastModified:" + now);
return now;
}*/
}

编译CacheServlet.java文件,确保编译后生成的class文件放置进了d:mywebWEB-INFclasses目录中。


(2)在d:myweb目录中编写一个名称为CacheTest.html的网页文件,如例程4-10所示。

例程4-10 CacheTest.html

缓存测试

(3)为了便于查看浏览器如何生成缓存内容,最好是先删除掉Internet临时文件夹中保存的所有缓存内容。单击IE浏览器的“工具”“Internet选项”菜单,打开如图4.16所示的“Internet选项”对话框,接着再单击“常规”选项卡中的“Internet临时文件”栏中的“删除文件”按钮,这就删除了Internet临时文件夹中保存的所有缓存内容。单击“常规”选项卡中的“Internet临时文件”栏中的“设置”按钮,在打开的“设置”对话框框中单击“Internet临时文件夹”栏中的“查看文件”按钮,打开如图4.17所示的Internet临时文件夹,可以看到其中已经不再有任何缓存的文件。另外,在“设置”对话框框中还需要将“检查所存网页的较新版本”的功能项恢复为默认的“自动”。
在浏览器地址栏中输入如下地址:
http://localhost:8080/it315/CacheTest.html
在浏览器窗口中显示的结果页面中,单击“缓存测试”超链接访问CacheServlet。再次打开Internet临时文件夹,这时可以看到其中生成了刚才访问过的CacheTest.html和CacheServlet这两个页面的缓存文件,如图4.18所示。选中其中的CacheServlet缓存文件,从Windows资源管理器窗口中显示出的摘要信息中可以看到,CacheServlet缓存文件中记录的上次修改时间为“无”。

(4)在命令行窗口中执行telnet 127.0.0.1 8080命令,连接上Tomcat WEB服务器后,接着在telnet程序命令窗口中,输入如下内容:
GET /it315/servlet/CacheServlet HTTP/1.1<回车>
Host:<空格><回车>
<回车>
telnet窗口中显示出的结果如图4.19所示。

CacheServlet返回的响应消息中没有Last-Modified头字段,这正是图4.18中显示的CacheServlet缓存文件的上次修改时间为“无”的原因

分享到:
评论

相关推荐

    Web开发中分布式缓存技术的研究.pdf

    这些实践案例不仅为分布式缓存技术的理论提供了实例支撑,也为Web开发人员在实际工作中选择和应用分布式缓存技术提供了专业的指导。 总体来说,随着技术的进步和业务需求的增长,分布式缓存技术在Web开发中的重要性...

    Web 开发中分布式缓存技术的分析与研究.pdf

    分布式缓存技术是在现代网络和计算机技术高速发展的背景下应运而生的,它在处理Web开发中海量并发请求、减轻数据库服务器负担、提升用户体验等方面发挥着重要作用。分布式缓存技术的核心在于其能够通过合理的数据...

    web代理服务器缓存设计

    本文介绍了Web缓存的基本原理、关键技术以及常见的算法策略,希望能为从事Web缓存研究和开发的人员提供一定的参考和启示。在未来的工作中,还可以探索更多高效的缓存算法和技术,以满足不断变化的网络环境和用户需求...

    Web开发敏捷之道--应用Rails进行敏捷Web开发 之 Depot代码。

    标题中的“Web开发敏捷之道--应用Rails进行敏捷Web开发 之 Depot代码”表明这是一个关于使用Ruby on Rails框架进行敏捷Web开发的示例项目,名为Depot。Ruby on Rails(简称Rails)是一个开源的Web应用程序框架,它...

    Web应用服务器缓存浅谈PPT

    在Web开发中,服务器缓存是一种提高性能和响应速度的关键技术。本讲座将探讨Web应用服务器缓存的基础知识,包括其工作原理、常见类型和最佳实践。通过学习,我们可以更好地理解如何利用缓存提升Web服务的效率。 ...

    海康威视 摄像头web 新版开发文档 含插件和多种功能demo

    对于海康威视摄像头的Web开发而言,这份新版文档至关重要,因为它涵盖了最新的技术更新和优化,为开发者提供了全面的开发支持。 文档中的插件是实现摄像头Web功能的关键。这些插件通常用于处理视频流、图像捕获、...

    Web应用中的海量数据访问缓存技术.pdf

    《Web应用中的海量数据访问缓存技术》不仅提供了对现有缓存技术的全面概述,更重要的是,它创新性地提出了一种整合线程池、连接池和数据Cache技术的框架模型,有效解决了Web应用在处理海量数据时面临的瓶颈问题。...

    基于Web的多媒体CAI课件开发过程中若干问题的研究和实践.docx

    "基于Web的多媒体CAI课件开发过程中若干问题的研究和实践" 本文主要研究基于Web的多媒体CAI课件开发过程中的一些问题和实践,旨在解决传统类型的课件的不足之处,结合了Web技术的发展和多媒体技术的结合,提出了...

    海康威视web开发包3.0

    海康威视作为全球领先的安防产品及解决方案提供商,其web开发包3.0是专为开发者设计的一款工具,旨在帮助他们轻松地在web环境中集成和控制海康威视的摄像头设备。这款开发包以Java语言为基础,提供了丰富的API和示例...

    过滤器在Java Web开发中的应用研究.zip

    Java Web开发中的过滤器(Filter)是Servlet技术的一部分,它在Web应用程序中扮演着至关重要的角色。过滤器允许开发者在请求被发送到目标资源(如Servlet、JSP页面)之前和响应被返回给客户端之后对请求和响应进行...

    《jQuery+BootstrapWeb开发案例教程(在线实训版)》案例源码.zip

    在本教程的源码压缩包中,包含了一个名为"57786《jQuery+Bootstrap Web开发案例教程(在线实训版)》案例源码"的文件,这很可能是教程中的所有实例代码集合。通过分析这些源码,我们可以深入了解如何将jQuery与...

    数据挖掘技术在Web预取中的应用研究.pdf

    ### 数据挖掘技术在Web预取中的应用研究 #### 摘要解读 本文主要探讨了如何运用数据挖掘技术提升Web预取(Web Prefetching)的效率,进而改善用户在网络浏览过程中的体验。随着互联网用户的急剧增加以及网络本身...

    开发web,web开发。

    标题和描述中提到的“开发web,web开发”是一个广泛的议题,涵盖了从网页设计到后端服务器处理的各个方面。在此,我们将深入探讨Web开发的关键知识点。 首先,我们要理解Web开发的基础——HTML(HyperText Markup ...

    基于JFinal框架的Java Web应用开发研究.pdf

    常见的Java Web开发框架像Struts、Spring、Hibernate等,虽然使用人数较多,但是它们在使用上较为复杂,整合过程较为繁琐。JFinal框架作为SSH框架的替代方案,不但可以提高项目代码的可维护性和可扩展性,更可以大...

    以SSH框架与jQuery技术为_省略_础的Java_Web开发应用探讨_何晶.pdf

    总结而言,SSH框架和jQuery技术在Java-Web开发中的应用能够提升项目的开发效率,增强系统的稳定性和可维护性,同时提供优秀的用户体验。随着技术的不断发展,SSH和jQuery的结合将继续在Java-Web开发领域发挥重要作用...

    WEB数据库开发与研究,包括实验要求

    8. **安全性**:Web开发中必须考虑的安全问题包括SQL注入、XSS(跨站脚本攻击)、CSRF(跨站请求伪造)等。开发者应熟悉相应的防护策略,如参数化查询、输入验证、令牌机制等。 9. **性能优化**:包括数据库索引...

    HTML5的Web前端开发技术分析.pdf

    在Web前端开发中,HTML5技术可以实现自动适应不同的设备和屏幕大小,解决了网页在不同设备上显示的问题。同时,HTML5技术也可以实现离线缓存,解决了在一些地区由于信号不良导致的网页访问问题。 通过对HTML5技术的...

    分布式数据缓存技术研究.pdf

    它设计的目标是减少数据库访问,将经常访问的数据暂存到内存中,以提高Web应用程序的性能。Memcached不支持持久化存储,但可以通过设置内存上限和LRU(Least Recently Used)策略来管理数据。 2.3 Hadoop HBase ...

    PHP和MySQL Web开发(原书第4版)+源代码

    5. **Web安全**:网络安全是Web开发中的重要一环。书中会讨论如何防止SQL注入、跨站脚本攻击(XSS)、跨站请求伪造(CSRF)等问题,以及如何实现安全的用户认证和授权。 6. **表单处理**:创建和处理HTML表单,包括...

Global site tag (gtag.js) - Google Analytics