前言
HTTP – Hypertext Transfer Protocol (超级文本传输协议)。HTTP协议位于应用层,建立在TCP/IP协议的基础上。HTTP协议使用可靠的TCP连接,默认端口是80。
HTTP 1.1对应RFC2068, URL
1. HTTP Request
HTTP请求由3部分组成:
n First line
请求方法、URI和HTTP协议的版本
n Request Header
n Request Content
1) First Line
n 3者都位于request的第一行,且以空格分隔。
POST /hello.jsp HTTP/1.1 |
n URI
Uniform Resource Identifier,统一资源标识符。RFC2396,URL是URI的一个子类别。
n Request Method
Request Method |
Function |
GET |
Client通过这种请求方式获取server上的文档 |
POST |
Client通过这种方式可以发送大量信息给服务器。获取server上的文档 |
HEAD |
用于在client和server之间交流一些内部数据,server不会返回具体的文档。这些数据不会影响用户浏览网页,对用户透明。HEAD请求一般不单独使用,通常对其他请求方式起辅助作用。一些搜索引擎使用HEAD请求方式来获取网页的标志信息,还有一些HTTP服务器在进行安全认证时,用这个方式来传递认证信息。 |
PUT |
Client通过这种方式上传文档给server。 |
DELETE |
客户程序通过这种方式来删除远程服务器上的某个文档。 |
2) Request Header
n 包含客户端环境和请求正文信息。
n 请求头和正文之间必须以空行分隔,即只有CRLF符号的行,CRLF-Carriage Return Linefeed-\r\n。
n
username=aa&password=bb&submit=submit |
正文中可以包含客户以POST方式提交的表单数据:
2. HTTP Response
HTTP相应也有3部分组成:
n First Line
协议的版本、状态代码、描述
n Response Header
n
HTTP /1.1 200 OK Server: Apache-Coyote/1.1 Content-type: text/html; charset=GBK Content-length: 102
<html> <head> <title>helloapp</title> </head> <body> <h1>hello</hello> </body> </html> |
Response Content
1) First Line
n 协议的版本、状态代码、描述3者都位于response的第一行,且以空格分隔。
HTTP /1.1 200 OK
|
n 状态码相关信息请见附件文档《HTTP Response Status》。
2) Response Header
n
Server: Apache-Coyote/1.1 // 服务器类型 Content-type: text/html; charset=GBK // 正文类型 Content-length: 102 // 正文长度 |
包含服务器类型、正文类型和正文长度等信息。
3) Response Content
n HTTP响应头和正文内容之间必须用空行分隔,详细可以参见Request Content。
浏览器接收到HTTP响应后,会根据正文的不同类型来进行不同的处理。HTTP协议采用MIME协议来规范正文的数据类型,详细请参见附录文档《MIME Notes》。HTTP响应头中的Content-type用于指定请求正文和响应中文部分的MIME类型。
3. HTTP Response Code
Status |
Content |
Description |
200~299 |
OK |
|
100 |
Continue |
初始的请求已经接受,客户应当继续发送请求的其余部分 |
101 |
Switching Protocols |
服务器将遵从客户的请求转换到另外一种协议 |
200 |
OK |
一切正常,对GET和POST请求的应答文档跟在后面 |
201 |
Created |
服务器已经创建了文档,Location头给出了它的URL。 |
202 |
Accepted |
已经接受请求,但处理尚未完成。 |
203 |
Non-Authoritative Information |
文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝 |
204 |
No Content |
没有新文档,浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的 |
205 |
Reset Content |
没有新的内容,但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容 |
206 |
Partial Content |
客户发送了一个带有Range头的GET请求,服务器完成了它 |
300 |
Multiple Choices |
客户请求的文档可以在多个位置找到,这些位置已经在返回的文档内列出。如果服务器要提出优先选择,则应该在Location应答头指明 |
301 |
Moved Permanently |
客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。 |
302 |
Found |
类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。 |
303 |
See Other |
类似于301/302,不同之处在于,如果原来的请求是POST,Location头指定的重定向目标文档应该通过GET提取 |
304 |
Not Modified |
客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。 |
305 |
Use Proxy |
客户请求的文档应该通过Location头所指明的代理服务器提取 |
307 |
Temporary Redirect |
和302(Found)相同。许多浏览器会错误地响应302应答进行重定向,即使原来的请求是 POST,即使它实际上只能在POST请求的应答是303时才能重定向。由于这个原因,HTTP 1.1新增了307,以便更加清除地区分几个状态代码: 当出现303应答时,浏览器可以跟随重定向的GET和POST请求;如果是307应答,则浏览器只能跟随对GET请求的重定向。 |
400 |
Bad Request |
请求出现语法错误。 |
401 |
Unauthorized |
客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,然后在填写合适的Authorization头后再次发出请求。 |
403 |
Forbidden |
资源不可用。 |
404 |
Not Found |
无法找到指定位置的资源 |
405 |
Method Not Allowed |
请求方法(GET、POST、HEAD、Delete、PUT、TRACE等)对指定的资源不适用。 |
406 |
Not Acceptable |
指定的资源已经找到,但它的MIME类型和客户在Accpet头中所指定的不兼容 |
407 |
Proxy Authentication Required |
类似于401,表示客户必须先经过代理服务器的授权。 |
408 |
Request Timeout |
在服务器许可的等待时间内,客户一直没有发出任何请求。客户可以在以后重复同一请求。 |
409 |
Conflict |
通常和PUT请求有关。由于请求和资源的当前状态相冲突,因此请求不能成功。 |
410 |
Gone |
所请求的文档已经不再可用,而且服务器不知道应该重定向到哪一个地址。它和404的不同在于,返回407表示文档永久地离开了指定的位置,而404表示由于未知的原因文档不可用。 |
411 |
Length Required |
服务器不能处理请求,除非客户发送一个Content-Length头。 |
412 |
Precondition Failed |
请求头中指定的一些前提条件失败 |
413 |
Request Entity Too Large |
目标文档的大小超过服务器当前愿意处理的大小。如果服务器认为自己能够稍后再处理该请求,则应该提供一个Retry-After头 |
414 |
Request URI Too Long |
URI太长 |
416 |
Requested Range Not Satisfiable |
服务器不能满足客户在请求中指定的Range头 |
500 |
Internal Server Error |
服务器遇到了意料不到的情况,不能完成客户的请求 |
501 |
Not Implemented |
服务器不支持实现请求所需要的功能。例如,客户发出了一个服务器不支持的PUT请求 |
502 |
Bad Gateway |
服务器作为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答 |
503 |
Service Unavailable |
服务器由于维护或者负载过重未能应答。例如,Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个Retry-After头 |
504 |
Gateway Timeout |
由作为代理或网关的服务器使用,表示不能及时地从远程服务器获得应答 |
505 |
HTTP Version Not Supported |
服务器不支持请求中所指明的HTTP版本 |
4. HTTP Response Code Summary
Status |
Description |
1xx |
信息提示,表示临时的相应 |
2xx |
响应成功,表明服务器成功地接收了客户端请求。 |
3xx |
重定向 |
4xx |
客户端错误,表明客户端可能有问题 |
5xx |
服务器错误,表明服务器由于遇到某种错误而不能响应客户端请求。 |
5. Version Summary
Version |
Content |
Update Date |
V0.15 |
增加reCAPTCHA验证,防止spam |
2008.02.20 |
v0.12 |
修正一个已知问题,因某些服务器不支持直接获取header而返回403错误。 |
2008.02.14 |
v0.11 |
增加了代理;增加判断跳转的路径。 |
2008.02.11 |
v0.10 |
改进循环机制,最多可以检查连续五次跳转。 |
2008.02.05 |
v0.03 |
可以检查两次跳转。 |
2008.02.04 |
v0.02 |
可以检测所有的状态值。比如301永久重定向,302临时重定向,404错误,或者是200正常等。 |
|
v0.01 |
可以检测网址或者网页的部分服务器返回之状态值。 |
|
评论