`
cczj2008
  • 浏览: 3591 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

(三) 理解HTTP消息头

阅读更多
这一次主要来观察HTTP消息头中客户端的请求,从中找到一些有意思的内容。

1 HTTP_REFERER
写两个简单的网页:
a.htm:
<a href=b.htm>to page b</a>
b.htm:
haha
内容很简单,就是网页A中有一个到B的链接。把它们放到IIS上,并访问网页A,从中再点击到B的链接,于是看到了B页的“haha”。那么这两次请求有什么不同吗?观察它们所发送的HTTP消息头,最明显的区别就是访问B页时比访问A页时多了一行:
Referer: http://localhost/a.htm
这一行就表示,用户要访问的B页是从A页链接过来的。
服务器端要想取得这个值也是很容易的,以ASP为例,只需要写一句
<% =Request.ServerVariables("HTTP_REFERER") %>
就可以了。
一些网站通过HTTP_REFERER来做安全验证,判断用户是不是从允许的页面链接来的,而不是直接从浏览器上打URL或从其他页面链接过来,这样可以从一定程度上防止网页被做非法使用。但从上述原理来看,想要骗过服务器也并不困难,只要手工构造输入的HTTP消息头就可以了,其他常用的手段还有通过HOSTS文件伪造域名等。
除了超链接以外,还有其他几种方式会导致HTTP_REFERER信息被发送,如:
内联框架:<iframe src=b.asp></iframe>
框架集:<frameset><frame src=b.asp></frameset>
表单提交:<form action=b.asp><input type=submit></form>
SCRIPT引用:<script src=b.asp></script>
CSS引用:<link rel=stylesheet type=text/css href=b.asp>
XML数据岛:<xml src=b.asp></xml>
而以下形式不会发送HTTP_REFERER:
script转向:<script>location.href="b.asp"</script>
script开新窗口:<script>window.open("b.asp");</script>
META转向:<meta http-equiv="refresh" content="0;URL=b.asp">
引入图片:<img src=b.asp>

2 COOKIE
COOKIE是大家都非常熟悉的了,通过它可以在客户端保存用户状态,即使用户关闭浏览器也能继续保存。那么客户端与服务器端是如何交换COOKIE信息的呢?没错,也是通过HTTP消息头。
首先写一个简单的ASP网页:
<%
Dim i
i =  Request.Cookies("key")
Response.Write i
Response.Cookies("key") = "haha"
Response.Cookies("key").Expires = #2007-1-1#
%>
第一次访问此网页时,屏幕上一片白,第二次访问时,则会显示出“haha”。通过阅读程序不难发现,屏幕上显示的内容实际上是COOKIE的内容,而第一次访问时还没有设置COOKIE的值,所以不会有显示,第二次显示的是第一次设置的值。那么对应的HTTP消息头应该是什么样的呢?
第一次请求时没什么不同,略过
第一次返回时消息内容多了下面这一行:
Set-Cookie: key=haha; expires=Sun, 31-Dec-2006 16:00:00 GMT; path=/
很明显,key=haha表示键名为“key”的COOKIE的值为“haha”,后面是这则COOKIE的过期时间,因为我用的中文操作系统的时区是东八区,2007年1月1日0点对应的GMT时间就是2006年12月31日16点。
第二次再访问此网页时,发送的内容多了如下一行:
Cookie: key=haha
它的内容就是刚才设的COOKIE的内容。可见,客户端在从服务器端得到COOKIE值以后就保存在硬盘上,再次访问时就会把它发送到服务器。发送时并没有发送过期时间,因为服务器对过期时间并不关心,当COOKIE过期后浏览器就不会再发送它了。
如果使用IE6.0浏览器并且禁用COOKIE功能,可以发现服务器端的set-cookie还是有的,但客户端并不会接受它,也不会发送它。有些网站,特别是在线投票网站通过记录COOKIE防止用户重复投票,破解很简单,只要用IE6浏览器并禁用COOKIE就可以了。也有的网站通过COOKIE值为某值来判断用户是否合法,这种判断也非常容易通过手工构造HTTP消息头来欺骗,当然用HOSTS的方式也是可以欺骗的。

3 SESSION
HTTP协议本身是无状态的,服务器和客户端都不保证用户访问期间连接会一直保持,事实上保持连接是HTTP1.1才有的新内容,当客户端发送的消息头中有“Connection: Keep-Alive”时表示客户端浏览器支持保持连接的工作方式,但这个连接也会在一段时间没有请求后自动断开,以节省服务器资源。为了在服务器端维持用户状态,SESSION就被发明出来了,现在各主流的动态网页制做工具都支持SESSION,但支持的方式不完全相同,以下皆以ASP为例。
当用户请求一个ASP网页时,在返回的HTTP消息头中会有一行:
Set-Cookie: ASPSESSIONIDCSQCRTBS=KOIPGIMBCOCBFMOBENDCAKDP; path=/
服务器通过COOKIE的方式告诉客户端你的SESSIONID是多少,在这里是“KOIPGIMBCOCBFMOBENDCAKDP”,并且服务器上保留了和此SESSIONID相关的数据,当同一用户再次发送请求时,还会把这个COOKIE再发送回去,服务器端根据此ID找到此用户的数据,也就实现了服务器端用户状态的保存。所以我们用ASP编程时可以使用“session("name")=user”这样的方式保存用户信息。注意此COOKIE内容里并没有过期时间,这表示这是一个当关闭浏览器时立即过期的COOKIE,它不会被保存到硬盘上。这种工作方式比单纯用COOKIE的方式要安全很多,因为在客户端并没有什么能让我们修改和欺骗的值,唯一的信息就是SESSIONID,而这个ID在浏览器关闭时会立即失效,除非别人能在你浏览网站期间或关闭浏览器后很短时间内知道此ID的值,才能做一些欺骗活动。因为服务器端判断SESSION过期的方式并不是断开连接或关闭浏览器,而是通过用户手工结束SESSION或等待超时,当用户关闭浏览器后的一段时间里SESSION还没有超时,所以这时如果知道了刚才的SESSIONID,还是可以欺骗的。因此最安全的办法还是在离开网站之前手工结束SESSION,很多网站都提供“Logout”功能,它会通过设置SESSION中的值为已退出状态或让SESSION立即过期从而起到安全的目的。
SESSION和COOKIE的方式各有优缺点。SESSION的优点是比较安全,不容易被欺骗,缺点是过期时间短,如果用过在超过过期时间里没有向服务器发送任何信息,就会被认为超过过期了;COOKIE则相反,根据服务器端设置的超时时间,可以长时间保留信息,即使关机再开机也可能保留状态,而安全性自然大打折扣。很多网站都提供两种验证方式相结合,如果用户临时用这台电脑访问此访问则需要输入用户名和密码,不保存COOKIE;如果用户使用的是自己的个人电脑,则可以让网站在自己硬盘上保留COOKIE,以后访问时就不需要重新输入用户名和密码了。

4 POST
浏览器访问服务器常用的方式有GET和POST两种,GET方式只发送HTTP消息头,没有消息体,也就是除了要GET的基本信息之外不向服务器提供其他信息,网页表单(FROM)的默认提交方式就是用GET方式,它会把所有向服务器提交的信息都作为URL后面的参数,如a.asp?a=1&b=2这样的方式。而当要提交的数据量很大,或者所提交内容不希望别人直接看到时,应该使用POST方式。POST方式提交的数据是作为HTTP消息体存在的,例如,写一个网页表单:
<form method=post>
<input type=text name=text1>
<input type=submit>
</form>
访问此网页,并在表单中填入一个“haha”,然后提交,可以看到此次提交所发送的信息如下:
POST /form.asp HTTP/1.1
Accept: */*
Referer: http://localhost:8080/form.asp
Accept-Language: zh-cn
Content-Type: application/x-www-form-urlencoded
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; InfoPath.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
Host: localhost:8080
Content-Length: 10
Connection: Keep-Alive
Cache-Control: no-cache
Cookie: key=haha; ASPSESSIONIDCSQCRTBS=LOIPGIMBLMNOGCOBOMPJBOKP
text1=haha
前面关键字从“GET”变为了“POST”,Content-Type变成了“application/x-www-form-urlencoded”,后面内容并无大变化,只是多了一行:Content-Length: 10,表示提交的内容的长度。空行后面是消息体,内容就是表单中所填的内容。注意此时发送的内容只是“Name=Value”的形式,表单上其他的信息不会被发送,所以想直接从服务器端取得list box中所有的list item是办不到的,除非在提交前用一段script把所有的item内容都连在一起放到一个隐含表单域中。
如果是用表单上传文件,情况就要复杂一些了,首先是表单声明中要加上一句话:enctype='multipart/form-data',表示这个表单将提交多段数据,并用HTML:input type=file来声明一个文件提交域。
表单内容如下:
<form method=post enctype='multipart/form-data'>
<input type=text name=text1>
<input type=file name=file1>
<input type=submit>
</form>
我们为text1输入文字:hehe,为file1选择文件haha.txt,其内容为“ABCDEFG”,然后提交此表单。提交的完全信息为:
POST /form.asp HTTP/1.1
Accept: */*
Referer: http://localhost:8080/form.asp
Accept-Language: zh-cn
Content-Type: multipart/form-data; boundary=---------------------------7d62bf2f9066c
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; InfoPath.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
Host: localhost:8080
Content-Length: 337
Connection: Keep-Alive
Cache-Control: no-cache
Cookie: key=haha; ASPSESSIONIDCSQCRTBS=LOIPGIMBLMNOGCOBOMPJBOKP
-----------------------------7d62bf2f9066c
Content-Disposition: form-data; name="text1"
hehe
-----------------------------7d62bf2f9066c
Content-Disposition: form-data; name="file1"; filename="H:\Documents and Settings\Administrator\桌面\haha.txt"
Content-Type: text/plain
ABCDEFG
-----------------------------7d62bf2f9066c--

显然这个提交的信息要比前述的复杂很多。Content-Type变成了“multipart/form-data”,后面还多了一个boundary,此值是为了区分POST的内容的区段用的,只要在内容中遇到了此值,就表示下面要开始一个新的区段了,每个区段的内容相对独立。如果遇到的是此值后面连着两个减号,则表示全部内容到此结束。每个段也分为段头和段体两部分,用空行隔开,每段都有自己的类型和相关信息。如第一区段是text1的值,它的名称是“text1”,值为“hehe”。第二段是文件内容,段首里表明了此文件域的名称“file1”和此文件在用户磁盘上的位置,后面就是文件的内容。
如果我们想要自己写一个上传文件组件来接收HTML表单传送的文件数据,那么最核心的任务就是解析此数据包,从中取得需要的信息。
分享到:
评论

相关推荐

    HTTP消息头详解.docx

    ### HTTP消息头详解 ...通过理解这些消息头的意义和作用,可以帮助开发者更有效地管理和控制HTTP通信过程中的各种细节。在实际开发过程中,正确设置和利用HTTP消息头不仅可以提高网络通信的效率,还能提升用户体验。

    sip消息头功能详解

    首先,SIP消息由三部分组成:起始行、消息头和消息体。在给出的例子中,我们看到一个SIP INVITE请求,这是SIP中用于邀请另一个用户加入会话的最常见方法。起始行包含了请求类型(INVITE),请求URI(sip:victor@add....

    实现隐式和显式 SOAP 消息头

    ### 三、显式SOAP消息头 1. **显式处理**: 这些头信息不会自动处理,而是需要客户端或服务器端的代码来读取和处理。它们不设置"mustUnderstand"属性,或者设置为"0"。 ```xml ...

    Http通过响应头控制浏览器行为

    本主题将深入探讨HTTP通信中的消息头与响应头,以及如何通过它们来控制浏览器行为。我们将以一个简单的示例项目"HttpTest"为背景,分析相关知识点。 一、HTTP消息头与响应头 1. HTTP消息结构:HTTP请求由三部分...

    HTTP协议的头信息详解.pdf

    HTTP 协议头信息详解 HTTP 协议头信息是 HTTP 消息的重要组成部分,包括通用头、请求头、响应头和实体头四个部分。每个头域由一个域名、冒号和域值三...了解 HTTP 协议头信息可以帮助我们更好地理解和应用 HTTP 协议。

    HTTP协议头访问WEB服务器

    而"HTTP响应"则包括状态行(协议版本、状态码和状态消息)、响应头部、空行和响应体。状态码是一个三位数字,如200表示成功,404表示未找到,500表示服务器内部错误。响应头包含了服务器返回的信息,如服务器类型、...

    http头信息详解 对http1.0和http1.1的常用头做出详细解释

    HTTP头信息对于理解HTTP协议的工作原理至关重要。通过掌握通用头、请求头和响应头的使用,开发者可以更有效地管理和优化Web应用程序的性能。了解这些头部字段的功能和用法,可以帮助开发者更好地控制客户端与服务器...

    HTTP协议之消息报头

    HTTP消息由请求消息和响应消息组成,每种消息都包括开始行(请求消息中的请求行或响应消息中的状态行)、消息报头、空行(仅含CRLF)和消息正文等部分。本篇文章将深入探讨HTTP消息报头中的各种属性及其功能。 ####...

    02HTTP请求头响应头详解1

    总结,HTTP请求头和响应头是HTTP通信中不可或缺的部分,它们提供了关于请求和响应的元信息,帮助客户端和服务器理解彼此的需求和响应。了解并正确使用这些头信息对于构建高效的Web应用程序至关重要。在实际开发中,...

    短消息长消息

    ### 长消息技术解析与应用 #### 长消息定义及背景 在现代通信领域,尤其是基于GSM网络的短消息服务(SMS)中,根据消息内容的...通过对长消息技术的理解和掌握,可以帮助开发者更好地设计和优化基于短信的服务和应用。

    Android 仿QQ首页的消息和电话的切换,首页的头部(完全用布局控制)

    在这个项目中,我们完全通过布局管理来控制首页头部的功能,无需借助复杂的第三方库,这能帮助开发者更好地理解Android的基础架构和布局系统。 首先,我们来看“消息”和“电话”这两个功能的切换。在QQ应用中,...

    HTTP协议的分析和理解

    使用Telnet可以让我们更直接地理解HTTP协议的工作方式和消息格式。 HTTP协议的无状态特性使得它需要通过一些机制来维护状态,比如Cookie和Session。此外,HTTP协议的无连接特性可以通过持续连接(keep-alive)进行...

    HTTP协议头字段及分析

    ### HTTP协议头字段及分析 #### 一、概述 HTTP(HyperText Transfer Protocol)作为互联网上应用最为广泛的一种网络协议,主要用于规定客户端与服务器之间如何通信。它是一种基于请求与响应模型的应用层协议,用于...

    SIP消息之逐项讲解.ppt

    3. **消息头域**: SIP消息由起始行、消息头和消息体组成。消息头包括From、To、Call-ID、CSeq、Via等字段,它们提供了会话标识、序列号、路由信息等关键数据。 4. **From和To头**: From头指示消息的发起者,To头...

    Java向苹果服务器推送消息(Java实现HTTP/2协议发送APNS)

    2. **Java HTTP/2库**:Java标准库在JDK 9及以后版本开始支持HTTP/2,但为了兼容JDK 11,你可以使用第三方库,如Jetty或OkHttp。这些库提供了与APNs交互所需的HTTP/2客户端功能。 3. **构建推送通知**:APNs通知由...

    HTTP协议的Header头信息详解.txt

    #### 三、常用Header头信息详解 ##### 1. Cache-Control `Cache-Control`头部用于指定如何缓存文档。它的值可以包括多个指令,每个指令都有特定的功能: - **no-cache**:强制缓存必须重新验证。 - **no-store**...

    消息中间件和jms消息服务

    JMS消息由消息头、属性和消息体三部分组成。消息头包含了识别和路由信息,如JMSDestination、JMSMessageID等,这些由发送方或JMS Provider设置。属性允许用户自定义额外的信息,而消息体则承载实际的数据内容。 在...

    Linux消息队列分析及应用

    通过对内核中相关代码的深入分析,我们可以更好地理解消息队列的工作原理,并在实际开发中有效地利用这一强大的IPC工具。无论是处理并发请求还是实现分布式系统中的通信,消息队列都是值得深入研究和掌握的关键技术...

Global site tag (gtag.js) - Google Analytics