1. 协议
a. TCP/IP整体构架概述
TCP/IP协议并不完全符合OSI的七层参考模型。传统的开放式系统互连参考模型,是一种通信协议的7层抽象的参考模型,其中每一层执行某一特定任务。该模型的目的是使各种硬件在相同的层次上相互通信。这7层是:物理层、数据链路层、网路层、传输层、话路层、表示层和应用层。而TCP/IP通讯协议采用了4层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。这4层分别为:
i. 应用层:应用程序间沟通的层,如超文本传送协议(HTTP)、简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。
ii. 传输层:在此层中,它提供了节点间的数据传送服务,如传输控制协议(TCP)、用户数据报协议(UDP)等,TCP和UDP给数据包加入传输数据并把它传输到下一层中,这一层负责传送数据,并且确定数据已被送达并接收。
iii. 互连网络层:负责提供基本的数据封包传送功能,让每一块数据包都能够到达目的主机(但不检查是否被正确接收),如网际协议(IP)。
iv. 网络接口层:对实际的网络媒体的管理,定义如何使用实际网络(如Ethernet、Serial Line等)来传送数据。
b. HTTP协议介绍:
i. HTTP是一种超文本传送协议(HyperText Transfer Protocol),是一套计算机在网络中通信的一种规则。在TCP/IP体系结构中,HTTP属于应用层协议,位于TCP/IP协议的顶层
ii. HTTP是一种无状态的的协议,意思是指 在Web 浏览器(客户端)和 Web 服务器之间不需要建立持久的连接。整个过程就是当一个客户端向服务器端发送一个请求(request),然后Web服务器返回一个响应 (response),之后连接就关闭了,在服务端此时是没有保留连接的信息。
iii. HTTP 遵循 请求/响应(request/response) 模型的,所有的通信交互都被构造在一套请求和响应模型中。
iv. 浏览WEB时,浏览器通过HTTP协议与WEB服务器交换信息,Web服务器向Web浏览器返回的文件都有与之相关的类型,这些信息类型的格式由MIME定义。
c. 协议的java实现方式
不论是TCP/IP协议也好,还是HTTP协议也好,java都是通过套接字(java.net.Socket)来实现的,可以参考我的另一篇技术博客:一个项目看java TCP/IP Socket编程(1.3版)
2. HTTP报文接口及客户端和服务器端交互原理
a. HTTP定义的事务处理由以下四步组成:
i. 建立连接:
例如我在浏览器里输入 http://cuishen.iteye.com,客户端请求这个地址时即打开了web服务器HTTP端口的一个套接字。因为在网络中间作为传递数据的实体介质就是网线,数据实质上是通过IO流进行输出和输入,这就不难理解我们为什么在写一个Servlet的时候要引用 import java.io.*; 的原因 ,包括我们在向客户端回发结果的时候要用到PrintWriter对象的println()方法。其实请求的这个地址还要加上端口号80,80可以不写,是因为浏览器默认的端口号是80。
在Java底层代码中是这样实现的,只不过它们已经帮我们做了。
- Socket socket = new Socket("cuishen.iteye.com",80);
- InputStream in = socket.getInputStream();
- OutputStream out = socket.getOutputStream();
Socket socket = new Socket("cuishen.iteye.com",80);
InputStream in = socket.getInputStream();
OutputStream out = socket.getOutputStream();
ii. 客户端发送HTTP请求报文(request)
一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令,是一个ASCII文本请求行,后跟0个或多个HTTP头标,一个空行和实现请求的任意数据。
即报文分四个部分:请求行,请求头标,空行和请求数据
1)请求行
请求行由三个标记组成:请求方法、请求URL和HTTP版本,中间用空格分开
例如: GET cuishen.iteye.com/blog/242842 HTTP/1.1
HTTP规范定义了8种可能的请求方法:(最常见的就是 GET 和 POST 两种方法)
GET -- 检索URI中标识资源的一个简单请求
HEAD -- 与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST -- 服务器接受被写入客户端输出流中的数据的请求
PUT -- 服务器保存请求数据作为指定URI新内容的请求
DELETE -- 服务器删除URI中命名的资源的请求
OPTIONS -- 关于服务器支持的请求方法信息的请求
TRACE -- Web服务器反馈Http请求和其头标的请求
CONNECT -- 已文档化但当前未实现的一个方法,预留做隧道处理
2)请求头标
请求头标:由key :value 健值组成,每行一对。请求头标用来通知服务器有关客户端的功能和标识。
HOST -- 请求的哪一个服务器端地址,主地址,比如:我的技术blog:cuishen.iteye.com
User-Agent -- 用户即客户端可以使用的浏览器 ,如: Mozilla/4.0
Accept -- 即客户端可以接受的MIME 类型列表,如image/gif、text/html、application/msword
Content-Length -- 只适用于POST请求,以字节给出POST数据的尺寸
3)空行
发送回车符和退行,通知服务器以下不再有头标。
4)请求数据
使用POST传送数据,最常使用的是Content-Type和Content-Length头标。
请求报文总结:
我们可以这样写出一个标准的 HTTP请求:
POST /blog/242842 HTTP1.1
HOST: cuishen.iteye.com/
User-Agent: Mozilla/4.0
Accpt: image/gif,text/html,application/pdf,image/png...
key=value&key=value&key=value...... (POST()请求的数据)
这上面的一个例子意思是:
我要去访问的服务器端的地址是cuishen.iteye.com/ 它下面的资源 /blog/242842
连起来就是: cuishen.iteye.com/blog/242842
这个页面用的是 HTTP1.1 规范,我的浏览器版本是Mozilla/4.0
可以支持的MIME格式为 image/gif,text/html,application/pdf,image/png...等等
这个MIME格式我们在servlet中写法是:response.setContentType("text/html;charset=gb2312");
或者在jsp中写法是:<%@ page contentType="text/html;charset=gb2312"%>
或者在html中写法是:<meta http-equiv="content-Type" content="text/html; charset=gb2312">
GET 和 POST 最直观的区别就是:GET方法将数据的请求跟在了所请求的URL后面,也就是在请求行里面我们是这么样来做的:
GET /blog/242842?key=value&key=value&key=value......HTTP1.1
实际上用 GET 是这样传递数据的:
http://cuishen.iteye.com/?page=2......
iii.服务器端响应请求生成结果并回发(response)
Web 服务器解析请求,定位指定的资源 http://cuishen.iteye.com/blog/242842
1)根据请求时的 GET/POST 对应的用servlet里的 doGet() / doPost()方法来处理(有可能是一些业务逻辑,也有可能是一些验证等等,也有可能是一些数据查询,提交等等)其有效的数据就来源于key=value&key=value&key=value......,以及其它的一些封装在 request 对象中的数据资源。
2)处理请求之后,由 response 对象得到 java.io.PrintWriter 输出流对象out,通过 out.println(); 将数据以指定的格式,如按照response.setcontentType("text/html;charset=gb2312");的格式输出到输出流。
它的响应报文与请求报文非常类似,其区别就在于:我们在请求阶段的请求行被状态行给替换了,再来看响应报文:
3)一个响应报文由四个部分组成:状态行、响应头标、空行、响应数据:
(a).状态行:
状态行由三个标记组成:HTTP版本、响应代码和响应描述。
HTTP1.1 --- 100 --- continue //继续追加后继内容
HTTP1.1 --- 200 --- OK //一切正常
HTTP1.1 --- 301 --- Moved Permanently //请求的文档在其它地方,会自动连接
HTTP1.1 --- 403 --- Forbidden //绝对拒绝你访问这个资源,不管授权没有
HTTP1.1 --- 400 --- Bad Request //客户端请求中的不良语法
HTTP1.1 --- 404 --- Not Found //最常见,绝对是大名鼎鼎的找不到
HTTP响应码:
1xx:提示性信息,告诉客户端应该对某些其它的动作作出响应
2xx:这些就代表了请求成功
3xx:重定向,为了完成请求,必须进一步执行的动作
4xx:客户端错误
500-599: 服务器端的错误
(b).响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。
Date: Sat, 31 Dec 2005 23:59:59 GMT --响应生成的日期和时间
ContentType: 'text/html;charset=gb2312'
Content-Length: 122 --响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。
(c).空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。
(d).响应数据:HTML文档和图像等,也就是HTML本身。out.println("<html>......");写到客户端。
- <html>
-
<head>
-
<title>Welcome to cuishen's IT blog</title>
-
</head>
-
<body>
- <!-- 这里是具体的内容,看到了这里
- 相信大家对 HTTP 工作原理及客户端与服务器交互过程已经很清楚了吧
-
-->
-
</body>
-
</html>
<html>
<head>
<title>Welcome to cuishen's IT blog</title>
</head>
<body>
<!-- 这里是具体的内容,看到了这里
相信大家对 HTTP 工作原理及客户端与服务器交互过程已经很清楚了吧
-->
</body>
</html>
iv. 服务器端关闭连接,客户端解析回发响应报文,恢复页面
1)浏览器先解析状态行,查看请求是否成功的状态代码--HTTP响应码:404 400 200 ....
2)解析每一个响应头标,如:
ContentType: text/html;charset=gb2312
Content-Length: 122 --- 响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。
3)读取响应数据HTML,根据标签<html></html>中的内容恢复标准的HTML格式页面或者其它。
4)一个HTML 文档可能包含其它的需要被载入的资源,浏览器会识别,并对这些资源再进行额外的请求,这个过程可以是循环的方式一直到所有的数据都按照响应头标中规定的格式恢复到页面中。
5)数据传送完毕,服务器端关闭连接,即无状态协议。
3. 总结
不要被高深的名词和理论吓到,其实HTTP客户端和服务器端的交互原理很简单:即先是浏览器和服务器端建立Socket无状态连接,也就是短连接,然后通过IO流进行报文信息(这个报文是严格遵循HTTP报文接口的)的交互,最后会话结束后就关闭连接。对于这些底层的协议和报文的打包解包交互的实现,其实java和浏览器早都已经封装好了,程序员只要专注于业务逻辑的实现就行啦,这些都不必关心!!
该文章延伸阅读
http://www.iteye.com/topic/470019
分享到:
相关推荐
Java Web程序中的客户端和服务器端交互是Web开发的基础,它涉及到网络通信协议、HTTP协议以及Java编程中的Socket编程。在本文中,我们将深入探讨这两个主要方面:协议和HTTP报文接口,以及它们如何在Java Web应用...
浅析Comet技术在Java Web实时系统开发中的应用 Comet技术是Java Web实时系统开发中的关键技术...Comet技术是Java Web实时系统开发中的关键技术之一,它可以实时地将更新的信息传送到客户端,提高了用户体验和满意度。
其次,需要编写能够处理事件驱动的服务器端代码,当有新数据可用时,能够及时推送到客户端。客户端也需要相应地调整,以适配长轮询或流的方式接收数据。 总的来说,Comet技术通过提供效服务器推能力,极大地增强了...
Servlet则是运行在服务器端的小型Java程序,用于处理客户端请求、生成动态Web内容和进行业务逻辑处理。 朴素模式是一种简单直接的Java Web设计模式,它将控制层和数据层的操作都交由JSP或JavaBean处理。这种模式...
Java Web开发技术是软件开发领域中的重要组成部分,它主要用于构建动态、交互式的互联网应用程序。Java以其平台无关性、稳定性和强大的功能,成为了Web开发的首选语言之一。本篇将深入浅出地探讨Java在Web开发中的...
Java 脚本是运行在服务器端的,而 JavaScript 脚本是运行在客户端的。 因此,在选择使用 Java 或 JavaScript 时,需要根据具体的应用场景和需求来决定。例如,如果需要访问服务器端的资源,可以选择使用 Java 脚本...
总之,"jspGraphic(浅析web图形报表的实现)"这个项目提供了从数据获取、处理到图表渲染的完整流程,对于学习和实践JSP与Java图形报表结合是一个很好的起点。通过深入研究,开发者可以掌握创建高效、动态的Web图形...
WebSocket是Web应用中一种实时通信协议,它在HTTP的基础上提供了全双工的通信方式,使得服务器和客户端可以双向传输数据,极大地改善...通过理解WebSocket的基本原理和实现机制,我们可以轻松地构建出高效的群聊系统。
ASP(Active Server Pages)是一套Microsoft开发的服务器端脚本环境,通过ASP可以结合HTML网页、ASP指令和ActiveX元件建立动态的、交互的且高效的Web服务器应用程序。其强势体现在:①简单易学,编辑方便。使用...
有了ASP程序,不必担心客户端的浏览器是否能运行所编写的代码,客户端的浏览器不需要执行这些脚本语言,所有的程序都将在服务器端直接执行。当程序执行完毕后,服务器仅将执行的结果返回给客户端浏览器,这样也就...
在Java中,Socket编程可以使用java.net.Socket和ServerSocket类来实现客户端和服务器端的通信。例如,服务器端创建ServerSocket监听特定端口,等待客户端连接;客户端使用Socket连接服务器,然后双方就可以通过输入/...
通过这样的流程,开发者可以创建出具有交互性的Web图形报表,使用户能够在浏览器端查看和操作数据。需要注意的是,为了优化性能,通常会将生成的图表缓存起来,只有当数据更新时才重新生成,以减少服务器的计算压力...
Struts2支持多种结果类型,JSON是一种常见的数据交换格式,尤其在前后端分离的应用中,用于服务器向客户端传递数据。JsonUtil通常包含序列化和反序列化对象到JSON格式的方法,以便与前端进行交互。 `UserAction....
再者,JSP(JavaServer Pages)是服务器端的编程技术,其Include和Scriptlets特性使得能够将常见的头部、底部等元素包含在各个页面中,实现动态内容的插入。JSP的优点在于它能够处理复杂的业务逻辑,但相对于纯静态...
5. application:代表整个Web应用环境的服务器端对象,所有用户共享。 6. out:JspWriter对象,用于向客户端输出内容。 7. config:ServletConfig对象,提供了对Servlet配置信息的访问。 8. page:代表当前的Servlet...
Direct Web Remoting (DWR) 是一个开源的Java库,允许JavaScript在客户端与服务器端进行交互,使得前端能够直接调用后端的Java方法。在Dwr3.0版本中,配置过程可以更加简洁,通过纯Java代码配置,不再依赖传统的dwr....
2. **B/S架构**:Browser/Server(浏览器/服务器)架构是一种典型的网络应用模式,其中客户端只需要安装浏览器即可使用系统提供的服务,而业务逻辑和数据处理都在服务器端完成,这大大降低了客户端的负担,提高了系统...
- **表单验证**:Struts2提供了强大的表单验证功能,包括客户端和服务器端的双重验证机制,提高了应用的安全性和用户体验。 - **国际化支持**:Struts2支持多语言和国际化,通过资源文件等方式可以轻松实现应用的多...