`

深入HTTP理解

    博客分类:
  • J2EE
 
阅读更多

HTTP详解 

一.一次简单HTTP 会话。 
大家都知道HTTP 是基于TCP协议之上的,那么是不是HTTP一定得基于TCP呢? 
不是,HTTP 要求的是建立在一个稳定的链接上,不管是TCP 还是UDP。 


 物理硬件将数据包以帧的形式发送 

看图,我们一次请求的时候,会将请求封装成http数据包,然后封装成Tcp数据包,再封装成Ip数据包, 通过物理硬件(网卡芯片)发生到指定地点,收到方先发现收到的是个ip数据包,所以通过ip协议解析Ip数据包,然后又发现里面是tcp数据包,就通过tcp协议解析Tcp数据包,接着发现是http数据包通过http协议再解析http数据包得到数据。 
那么这么一个过程,对整体的协议有了一个认识, 那么什么是http协议,tcp协议,ip协议 甚至是udp协议呢? 
百科上面有解释: http协议是超文本传输协议,这个解释对于很少接触网络的人怎么理解呢??  又是超文本 ,又是协议的,这些专业名称。 我不善言辞,但是我通过普通的方式去理解,但是我知道设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。说白了,它其实就是一种请求与响应协议,那么什么是请求,什么是响应? 
(一).请求(Requset) 
发出的请求信息包括以下几个(请求行,请求头标,空行,请求数据) 

  1.请求行:例如上图: POST /JS3/SERVICE_BACK….   HTTP/1.1 \r\n 

请求行里面主要包括 请求方法, 请求url 已经http版本号 
1).请求方法: 
HTTP/1.1协议中共定义了八种方法(有时也叫“动作”)来表明Request-URI指定的资源的不同操作方式: 
OPTIONS:返回服务器针对特定资源所支持的HTTP请求方法。也可以利用向Web服务器发送'*'的请求来测试服务器的功能性。 
HEAD:向服务器索要与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以在不必传输整个响应内容的情况下,就可以获取包含在响应消息头中的元信息。 
GET:向特定的资源发出请求。 
POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的创建和/或已有资源的修改。 
PUT:向指定资源位置上传其最新内容。 
DELETE:请求服务器删除Request-URI所标识的资源。 
TRACE:回显服务器收到的请求,主要用于测试或诊断。 
CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。 
2.请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有: 
User-Agent 客户端厂家和版本 
Accept 客户端可识别的内容类型列表 
Content-Length 附加到请求的数据字节数 
在HTTP/1.1协议中,所有的请求头,除Host外,都是可选的。 
3.空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。 
4.请求数据:使用POST传送数据,最常使用的是Content-Type和Content-Length头标。 

(二).响应(Response) 
一个响应信息主要包括  状态行,响应头标,空行,响应数据 

1.响应行:  http版本号,状态码 
1).状态码:状态代码的第一个数字代表当前响应的类型: 
1xx消息——请求已被服务器接收,继续处理 
2xx成功——请求已成功被服务器接收、理解、并接受 
3xx重定向——需要后续操作才能完成这一请求 
4xx请求错误——请求含有词法错误或者无法被执行 
5xx服务器错误——服务器在处理某个正确请求时发生错误 
2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。 
3.空行 

4.响应数据:HTML文档和图像等,也就是HTML本身。如上图由Content-length 和Content-type标识  


 了解了 http之后,又需要了解一些http版本之间差异: 

1. Http0.9:已过时。只接受GET一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持POST方法,因此客户端无法向服务器传递太多信息 
2. HTTP/1.0:这是第一个在通讯中指定版本号的HTTP协议版本,至今仍被广泛采用,特别是在代理服务器中。 
3. HTTP/1.1:当前版本。持久连接被默认采用,并能很好地配合代理服务器工作。还支持以管道方式在同时发送多个请求,以便降低线路负载,提高传输速度。 
4. HTTP/1.1相较于HTTP/1.0协议的区别主要体现在: 
缓存处理 
带宽优化及网络连接的使用 
错误通知的管理 
消息在网络中的发送 
互联网地址的维护 
安全性及完整性 

 
 5. 这就是HTTP1.0和HTTP1.1的短链接和长连接图请求响应图。在Http1.0中 , 访问一个包含有许多图像的网页文件的整个过程包含了多次请求和响应,每次请求和响应都需要建立一个单独的连接,每次连接只是传输一个文档和图像,上一次和下一次请求完全分离,也就是说在性能方面都有很大的影响。 

为了克服http1.0这种缺陷,HTTP 1.1支持持久连接,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟。一个包含有许多图像的网页文件的多个请求和应答可以在一个连接中传输,但每个单独的网页文件的请求和应答仍然需要使用各自的连接。HTTP 1.1还允许客户端不用等待上一次请求结果返回,就可以发出下一次请求,但服务器端必须按照接收到客户端请求的先后顺序依次回送响应结果,以保证客户端能够区分出每次请求的响应内容,这样也显著地减少了整个下载过程所需要的时间。 


二.Session和Cookies 
或许我们比较关心的是session和cookies,Session是服务器端的存储容器,Cookies是客户端存储数据容器, 
Session 两种基本实现方式: 
1.通过URL回显方式; 
2.通过Cookies实现 
如果浏览器的Cookies功能被禁止,那么就会使用URL回显方式, 及在每个url后面接jsessionid=...这样来找到服务器给客户端分配的Session来保证这是同一次会话。 
服务器给每个Session分配一个唯一的JSESSIONID,并通过Cookie发送给客户端。 
Cookies方式:在Cookie头中携带这个JSESSIONID。这样服务器能够找到这个客户端对应的Session。 

三.缓存: 
了解缓存之前先了解下刷新和输入网址后回车的区别 
强制刷新(ctrl+F5):不理会缓存协商,全部重新获取.此时请求中的Cache-Control值为no-cache 
刷新(F5)时:当点击浏览器上的刷新,客户端发送的请求中的Cache-Control均是max-age=0,表示validate操作,发送请求到服务器要求检查cache,再更新cache,一般得到的是304 Not Modified,表示没变动 
输入网址直接回车时:如果Expired或Cache-Control还未过期,则不会返回304状态,因为浏览器已经不用向web服务器发出请求 

Cache-Control 用于指定缓存指令,缓存指令是单向的(响应中出现的缓存指令在请求中未必会出现),且是独立的(一个消息的缓存指令不会影响另一个消息处理的缓存机制),HTTP1.0使用的类似的报头域为Pragma。 

Cache-Control:指定请求和响应遵循的缓存机制。在请求消息或响应消息中设置Cache-Control并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令包括no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached,响应消息中的指令包括public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age。 
各个消息中的指令含义如下: 
Public指示响应可被任何缓存区缓存。 
Private指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。 
no-cache指示请求或响应消息不能缓存 
no-store用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。 
max-age指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。 
min-fresh指示客户机可以接收响应时间小于当前时间加上指定时间的响应。 
max-stale指示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。 
一些缓存机制: 
response.setHeader('Cache-Control: max-age=8'); 
max-age=8表示最大生存期8秒,超过8秒浏览器必须去服务器重新读取,这个时间是以用户的读取页面开始计时的,而Expires是绝对时间。 
Expires:缓存过期的绝对时间,如果过了它指定的那个时间点,浏览器就不认缓存了,要去服务器重新请求一份最新的。 
Last-Modified:文档的最后修改时间,它的妙用就是:1 
如果是静态文件,客户端会发上来它缓存里的时间,apache会来比对,如果发现没有修改就直接返回一个头,状态码是304,字节数非常少,(高级版本还会增加比较Etag来确定文件是否变化)  


 Last-modified/If-Modified-Since与Etag/If-None-Match区别 

1.HTTP的Response中还会有另外一个Header叫Last-Modified,比如“Last-Modified: Thu, 06 Apr 2006 21:17:12 GMT”,浏览器访问一个URI得到这样的Resposne之后,就知道这个资源最后一次的修改时间,下次需要再次获得这个资源的时候,会发一个Request给Server,不过这个Request中有一条“If-Unmodified-Since: Thu, 06 Apr 2006 21:17:12 GMT”,如果在Server端在这个日期之后对这个资源进行了修改,就会照常返回这个资源给Client端,但是如果没有修改,就会返回一个304 (Not Modified) Response而不返回资源,  一个304 Response比一个静态资源通常小多了,这样就节省了网络带宽。 
2.除了Last-Modified,HTTP Response中还可能有另外一个Header: ETag。在多台负载均衡的服务器环境下,同一个文件可能会有不同的etag或者文件修改日期,浏览器每次都会重新下载,这点要根据实际情况考虑设置。 
3.比较一下Expires和Last-Modified这两个东西,似乎Last-Modified比不上Expires, 虽然它能够节省带宽,但是也需要发一个HTTP请求出去,而Expires却使得浏览器干脆连HTTP请求都不用发。不过当用户在IE或者Firefox里面按F5或者点击Refresh按钮的时候(不是在URL栏里重新输入一遍URL然后回车),就算对于有Expires的URI,一样也会发一个HTTP请求出去,所以,Last-Modified还是要用的(返回304),而且要和Expires一起用。

 

  • 大小: 16.2 KB
  • 大小: 85.4 KB
  • 大小: 32.9 KB
  • 大小: 18.4 KB
  • 大小: 95.3 KB
分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    王达老师深入理解计算机网络 书籍及配套学习资料

    《深入理解计算机网络》是王达老师的一部经典著作,主要涵盖了网络基础和TCP/IP协议栈的深度解析。这本书不仅提供了全面的理论知识,还包含了实际应用和问题解答,是学习计算机网络的重要参考资料。 首先,从标题...

    深入理解计算机系统及

    《深入理解计算机系统》是一本深受全球IT从业者和学生喜爱的经典教材,它全面而深入地讲解了计算机系统的各个层面,包括处理器、内存、输入/输出系统、操作系统、编译器以及网络等。这本书通过理论与实践相结合的...

    《深入理解Linux网络技术内幕》.rar

    《深入理解Linux网络技术内幕》是一本专注于Linux操作系统网络技术的专业书籍,对于想要深入学习Linux内核网络模块的开发者来说,是一份极具价值的参考资料。这本书涵盖了从底层网络设备驱动到高层网络协议处理的全...

    深入理解Nginx-陶辉-2版本.pdf.zip

    《深入理解Nginx》是陶辉编著的一本关于Nginx服务器的高级技术书籍,主要面向已经对Nginx有一定基础了解的读者。在深入探讨Nginx的2版本中,作者详细阐述了Nginx的核心特性和最新发展,帮助读者提升对Nginx的掌握...

    深入理解linux内核(中文第三版)高清完整PDF

    《深入理解Linux内核》是Linux领域的经典之作,它的第三版中文版提供了全面而深入的Linux内核解析,对于想要深入了解Linux操作系统底层运作原理的读者来说,无疑是一本宝贵的参考资料。书中涵盖了从进程管理、内存...

    深入理解HTTP协议

    深入理解HTTP协议

    方志朋版——深入理解Spring Cloud与微服务构建.pdf

    《深入理解Spring Cloud与微服务构建》是针对Java开发者,特别是对微服务架构感兴趣的开发者的一本重要参考资料。Spring Cloud作为目前最流行的微服务框架之一,它提供了构建分布式系统所需的多种工具和服务,包括...

    深入理解Android 卷I 扫描完整版

    《深入理解Android 卷I》是一本专门为Android开发者和爱好者准备的专业技术书籍,由邓凡平撰写。这本书全面而深入地探讨了Android操作系统的核心概念和技术,旨在帮助读者建立起扎实的Android开发基础,提升技术水平...

    深入理解高并发编程-核心技术原理

    【深入理解高并发编程-核心技术原理】是一本专注于讲解高并发编程核心概念和技术的书籍,由阿里P8级别的架构师及Mykit系列开源框架作者撰写。本书内容涵盖源码分析、基础案例、实战案例和面试相关知识,旨在帮助读者...

    深入理解计算机网络课件

    本课件"深入理解计算机网络"旨在帮助学习者全面掌握计算机网络的工作原理和实际应用。PPT形式的教学资料通常以图文并茂的方式呈现,便于理解和记忆。 1. **网络基础知识**:首先,我们需要了解计算机网络的基本概念...

    《深入理解Java 7 核心技术与最佳实践》PDF版本下载.txt

    根据提供的文件信息,我们可以推断出这是一本关于Java 7 的书籍——《深入理解Java 7 核心技术与最佳实践》,并且提供了该书PDF版本的下载链接。接下来,我们将围绕这一主题展开讨论,主要从以下几个方面进行深入...

    一步步深入理解Spring内部原理-带源码

    为了深入理解Spring的内部原理,我们可以从以下几个关键知识点入手。 1. **依赖注入(Dependency Injection, DI)**:这是Spring的核心特性之一,允许对象之间的依赖关系在运行时被外部容器管理,而不是由对象自身...

    深入理解android系统合集(Framework学习入门)

    《深入理解Android系统合集》是一部专为Android开发者和爱好者准备的深度学习资料,涵盖了Android Framework的学习入门。这个合集由邓凡平编著,分为两卷,分别为《深入理解Android 卷1》和《Android(卷2)(带全目录...

    《深入理解OpenCV:实用计算机视觉项目解析》英文原版

    《深入理解OpenCV:实用计算机视觉项目解析》系统地介绍如何使用OpenCV来构建与计算机视觉相关的应用,如增强现实、车牌识别、人脸检测等。每章都会介绍一个典型的计算机视觉应用问题,并并提供相关的背景介绍及全部...

    深入理解计算机系统(原书第三版)_翻译完整带书签

    《深入理解计算机系统》是计算机科学领域的一本经典著作,其第三版更是为读者提供了全面且深入的计算机系统知识。本书旨在帮助读者建立起从硬件到软件的全方位理解,包括CPU、内存管理、网络通信以及软件开发等多个...

    深入理解ANDROID 卷三

    《深入理解ANDROID 卷三》是一本专门为Android开发者和爱好者准备的专业书籍,旨在深度剖析Android系统的内部工作机制,帮助读者提升对Android平台的理解和应用能力。这本书的高清PDF版本经过精心修复,确保了书签的...

    深入理解android I-II(电子版-非扫描版)

    《深入理解Android I-II》是一套深度探讨Android操作系统核心机制和技术的权威书籍,分为两卷,旨在帮助读者从底层到应用层全面理解Android系统的工作原理。这套书籍的电子版是高清非扫描版本,保证了阅读体验,使得...

    深入理解Python中文版高清书签版+源码

    《深入理解Python》是一本深度剖析Python编程语言的著作,旨在帮助读者全面了解Python的核心概念、语法特性以及高级应用。这本书的高清PDF版本包含了书中的每一章内容,并且附带了书签,方便读者快速定位到感兴趣的...

Global site tag (gtag.js) - Google Analytics