`
wusuoya
  • 浏览: 641569 次
  • 性别: Icon_minigender_2
  • 来自: 成都
社区版块
存档分类
最新评论

在浏览器中简单输入一个网址,解密其后发生的一切(http请求的详细过程)

    博客分类:
  • web
 
阅读更多

在浏览器中简单输入一个网址,解密其后发生的一切(http请求的详细过程)

一个http请求的详细过程

我们来看当我们在浏览器输入http://www.mycompany.com:8080/mydir/index.html,幕后所发生的一切。

首先http是一个应用层的协议,在这个层的协议,只是一种通讯规范,也就是因为双方要进行通讯,大家要事先约定一个规范。

1.连接 当我们输入这样一个请求时,首先要建立一个socket连接,因为socket是通过ip和端口建立的,所以之前还有一个DNS解析过程,把www.mycompany.com变成ip,如果url里不包含端口号,则会使用该协议的默认端口号。

DNS的过程是这样的:首先我们知道我们本地的机器上在配置网络时都会填写DNS,这样本机就会把这个url发给这个配置的DNS服务器,如果能够 找到相应的url则返回其ip,否则该DNS将继续将该解析请求发送给上级DNS,整个DNS可以看做是一个树状结构,该请求将一直发送到根直到得到结 果。现在已经拥有了目标ip和端口号,这样我们就可以打开socket连接了。

2.请求 连接成功建立后,开始向web服务器发送请求,这个请求一般是GET或POST命令(POST用于FORM参数的传递)。GET命令的格式为:  GET 路径/文件名 HTTP/1.0
文件名指出所访问的文件,HTTP/1.0指出Web浏览器使用的HTTP版本。现在可以发送GET命令:

GET /mydir/index.html HTTP/1.0,

3.应答 web服务器收到这个请求,进行处理。从它的文档空间中搜索子目录mydir的文件index.html。如果找到该文件,Web服务器把该文件内容传送给相应的Web浏览器。

为了告知浏览器,,Web服务器首先传送一些HTTP头信息,然后传送具体内容(即HTTP体信息),HTTP头信息和HTTP体信息之间用一个空行分开。
常用的HTTP头信息有:
  ① HTTP 1.0 200 OK  这是Web服务器应答的第一行,列出服务器正在运行的HTTP版本号和应答代码。代码"200 OK"表示请求完成。
  ② MIME_Version:1.0 它指示MIME类型的版本。
  ③ content_type:类型 这个头信息非常重要,它指示HTTP体信息的MIME类型。如:content_type:text/html指示传送的数据是HTML文档。
  ④ content_length:长度值 它指示HTTP体信息的长度(字节)。


4.关闭连接:当应答结束后,Web浏览器与Web服务器必须断开,以保证其它Web浏览器能够与Web服务器建立连接。


下面我们具体分析其中的数据包在网络中漫游的经历

在网络分层结构中,各层之间是严格单向依赖的。“服务”是描述各层之间关系的抽象概念,即网络中各层向紧邻上层提供的一组操作。下层是服务提供者, 上层是请求服务的用户。服务的表现形式是原语(primitive),如系统调用或库函数。系统调用是操作系统内核向网络应用程序或高层协议提供的服务原 语。网络中的n层总要向n+1层提供比n-1层更完备的服务,否则n层就没有存在的价值。

传输层实现的是“端到端”通信,引进网间进程通信概念,同时也要解决差错控制,流量控制,数据排序(报文排序),连接管理等问题,为此提供不同的服 务方式。通常传输层的服务通过系统调用的方式提供,以socket的方式。对于客户端,要想建立一个socket连接,需要调用这样一些函数 socket() bind() connect(),然后就可以通过send()进行数据发送。

现在看数据包在网络中的穿行过程:

应用层

首先我们可以看到在应用层,根据当前的需求和动作,结合应用层的协议,有我们确定发送的数据内容,我们把这些数据放到一个缓冲区内,然后形成了应用层的报文data

传输层

这些数据通过传输层发送,比如tcp协议。所以它们会被送到传输层处理,在这里报文打上了传输头的包头,主要包含端口号,以及tcp的各种制信息,这些信息是直接得到的,因为接口中需要指定端口。这样就组成了tcp的数据传送单位segment。 tcp是一种端到端的协议,利用这些信息,比如tcp首部中的序号确认序号,根据这些数字,发送的一方不断的进行发送等待确认,发送一个数据段后,会开启 一个计数器,只有当收到确认后才会发送下一个,如果超过计数时间仍未收到确认则进行重发,在接受端如果收到错误数据,则将其丢弃,这将导致发送端超时重 发。通过tcp协议,控制了数据包的发送序列的产生,不断的调整发送序列,实现流控和数据完整。

网络层

然后待发送的数据段送到网络层,在网络层被打包,这样封装上了网络层的包头,包头内部含有源及目的的ip地址,该层数据发送单位被称为packet。网络层开始负责将这样的数据包在网络上传输,如何穿过路由器,最终到达目的地址。在这里,根据目的ip地址,就需要查找下一跳路由的地址。首先在本机,要查找本机的路由表,在windows上运行route print就可以看到当前路由表内容,有如下几项:
Active Routes Default Route Persistent Route.

整个查找过程是这样的:
(1)根据目的地址,得到目的网络号,如果处在同一个内网,则可以直接发送。
(2)如果不是,则查询路由表,找到一个路由。
(3)如果找不到明确的路由,此时在路由表中还会有默认网关,也可称为缺省网关,IP用缺省的网关地址将一个数据传送给下一个指定的路由器,所以网关也可能是路由器,也可能只是内网向特定路由器传输数据的网关。
(4)路由器收到数据后,它再次为远程主机或网络查询路由,若还未找到路由,该数据包将发送到该路由器的缺省网关地址。而数据包中包含一个最大路由跳数, 如果超过这个跳数,就会丢弃数据包,这样可以防止无限传递。路由器收到数据包后,只会查看网络层的包裹数据,目的ip。所以说它是工作在网络层,传输层的 数据对它来说则是透明的。

如果上面这些步骤都没有成功,那么该数据报就不能被传送。如果不能传送的数据报来自本机,那么一般会向生成数据报的应用程序返回一个“主机不可达”或 “网络不可达”的错误。

 

以windows下主机的路由表为例,看路由的查找过程
======================================================================
Active Routes:
Network Destination            Netmask                      Gateway              Interface                  Metric
0.0.0.0                                 0.0.0.0                       192.168.1.2           192.168.1.101           10
127.0.0.0                             255.0.0.0                   127.0.0.1               127.0.0.1                   1
192.168.1.0                         255.255.255.0           192.168.1.101       192.168.1.101           10
192.168.1.101                     255.255.255.255       127.0.0.1               127.0.0.1                   10
192.168.1.255                     255.255.255.255       192.168.1.101       192.168.1.101           10
 224.0.0.0                            240.0.0.0                   192.168.1.101       192.168.1.101           10
255.255.255.255                 255.255.255.255       192.168.1.101       192.168.1.101           1
Default Gateway:                192.168.1.2

Network Destination 目的网段  
Netmask 子网掩码  
Gateway 下一跳路由器入口的ip,路由器通过interface和gateway定义一调到下一个路由器的链路,通常情况下,interface和gateway是同一网段的。
Interface 到达该目的地的本路由器的出口ip(对于我们的个人pc来说,通常由机算机A的网卡,用该网卡的IP地址标识,当然一个pc也可以有多个网卡)。

网关这个概念,主要用于不同子网间的交互,当两个子网内主机A,B要进行通讯时,首先A要将数据发送到它的本地网关,然后网关再将数据发送给B所在的网关,然后网关再发送给B。
默认网关,当一个数据包的目的网段不在你的路由记录中,那么,你的路由器该把那个数据包发送到哪里!缺省路由的网关是由你的连接上的default gateway决定的,也就是我们通常在网络连接里配置的那个值。

通常interface和gateway处在一个子网内,对于路由器来说,因为可能具有不同的interface,当数据包到达时,根据 Network Destination寻找匹配的条目,如果找到,interface则指明了应当从该路由器的那个接口出去,gateway则代表了那个子网的网关地 址。

第一条      0.0.0.0   0.0.0.0   192.168.1.2    192.168.1.101   10
0.0.0.0代表了缺省路由。该路由记录的意思是:当我接收到一个数据包的目的网段不在我的路由记录中,我会将该数据包通过192.168.1.101 这个接口发送到192.168.1.2这个地址,这个地址是下一个路由器的一个接口,这样这个数据包就可以交付给下一个路由器处理,与我无关。该路由记录 的线路质量 10。当有多个条目匹配时,会选择具有较小Metric值的那个。

第三条      192.168.1.0   255.255.255.0  192.168.1.101   192.168.1.101  10
直联网段的路由记录:当路由器收到发往直联网段的数据包时该如何处理,这种情况,路由记录的interface和gateway是同一个。当我接收到一个 数据包的目的网段是192.168.1.0时,我会将该数据包通过192.168.1.101这个接口直接发送出去,因为这个端口直接连接着 192.168.1.0这个网段,该路由记录的线路质量 10 (因interface和gateway是同一个,表示数据包直接传送给目的地址,不需要再转给路由器)。

一般就分这两种情况,目的地址与当前路由器接口是否在同一子网。如果是则直接发送,不需再转给路由器,否则还需要转发给下一个路由器继续进行处理。

 

查找到下一跳ip地址后,还需要知道它的mac地址,这个地址要作为链路层数据装进链路层头部。这时需要arp协议,具体过程是这样的,查找arp 缓冲,windows下运行arp -a可以查看当前arp缓冲内容。如果里面含有对应ip的mac地址,则直接返回。否则需要发生arp请求,该请求包含源的ip和mac地址,还有目的地 的ip地址,在网内进行广播,所有的主机会检查自己的ip与该请求中的目的ip是否一样,如果刚好对应则返回自己的mac地址,同时将请求者的ip mac保存。这样就得到了目标ip的mac地址。

链路层

将mac地址及链路层控制信息加到数据包里,形成Frame,Frame在链路层协议下,完成了相邻的节点间的数据传输,完成连接建立,控制传输速度,数据完整。

物理层

物理线路则只负责该数据以bit为单位从主机传输到下一个目的地。

下一个目的地接受到数据后,从物理层得到数据然后经过逐层的解包 到 链路层 到 网络层,然后开始上述的处理,在经网络层 链路层 物理层将数据封装好继续传往下一个地址。

在上面的过程中,可以看到有一个路由表查询过程,而这个路由表的建立则依赖于路由算法。也就是说路由算法实际上只是用来路由器之间更新维护路由表, 真正的数据传输过程并不执行这个算法,只查看路由表。这个概念也很重要,需要理解常用的路由算法。而整个tcp协议比较复杂,跟链路层的协议有些相似,其 中有很重要的一些机制或者概念需要认真理解,比如编号与确认,流量控制,重发机制,发送接受窗口。

 

tcp/ip基本模型及概念


物理层

设备,中继器(repeater),集线器(hub)。对于这一层来说,从一个端口收到数据,会转发到所有端口。


链路层

协议:SDLC(Synchronous Data Link Control)HDLC(High-level Data Link Control) ppp协议独立的链路设备中最常见的当属网卡,网桥也是链路产品。集线器MODEM的某些功能有人认为属于链路层,对此还有些争议认为属于物理层设备。除 此之外,所有的交换机都需要工作在数据链路层,但仅工作在数据链路层的仅是二层交换机。其他像三层交换机、四层交换机和七层交换机虽然可对应工作在OSI 的三层、四层和七层,但二层功能仍是它们基本的功能。

因为有了MAC地址表,所以才充分避免了冲突,因为交换机通过目的MAC地址知道应该把这个数据转发到哪个端口。而不会像HUB一样,会转发到所有滴端口。所以,交换机是可以划分冲突域滴。


网络层

四个主要的协议:   
网际协议IP:负责在主机和网络之间寻址和路由数据包。     
地址解析协议ARP:获得同一物理网络中的硬件主机地址。     
网际控制消息协议ICMP:发送消息,并报告有关数据包的传送错误。     
互联组管理协议IGMP:被IP主机拿来向本地多路广播路由器报告主机组成员。

该层设备有三层交换机,路由器。


传输层

两个重要协议 TCP 和 UDP 。

端口概念:TCP/UDP 使用 IP 地址标识网上主机,使用端口号来标识应用进程,即 TCP/UDP 用主机 IP 地址和为应用进程分配的端口号来标识应用进程。端口号是 16 位的无符号整数, TCP 的端口号和 UDP 的端口号是两个独立的序列。尽管相互独立,如果 TCP 和 UDP 同时提供某种知名服务,两个协议通常选择相同的端口号。这纯粹是为了使用方便,而不是协议本身的要求。利用端口号,一台主机上多个进程可以同时使用 TCP/UDP 提供的传输服务,并且这种通信是端到端的,它的数据由 IP 传递,但与 IP 数据报的传递路径无关。网络通信中用一个三元组可以在全局唯一标志一个应用进程:(协议,本地地址,本地端口号)。

也就是说tcp和udp可以使用相同的端口。

可以看到通过(协议,源端口,源ip,目的端口,目的ip)就可以用来完全标识一组网络连接。

应用层

基于tcp:Telnet FTP SMTP DNS HTTP 
基于udp:RIP NTP(网落时间协议)和DNS (DNS也使用TCP)SNMP TFTP

分享到:
评论

相关推荐

    详细解密FineReport中的报表执行过程

    在使用报表开发工具FineReport进行报表开发时,理解其内部执行过程对于优化报表性能、调试和监控报表生成至关重要。FineReport中的报表执行过程可以分为两个主要步骤,即报表计算和页面转换。 首先,报表计算过程...

    python爬虫: 1、记录捕获各网站的数据 2、逆向JS(请求数据加密、响应数据解密)

    当浏览器访问一个网页时,它会发送一个HTTP GET请求到服务器,服务器接收到请求后返回HTTP响应,其中包含HTML页面内容。Python的requests库可以帮助我们模拟这些操作,通过发送GET或POST请求获取网页内容。 2. 逆向...

    C#2.0 开发的一个浏览器

    在本项目中,开发者使用了C# 2.0这一编程语言来构建一个自定义的浏览器应用。C#是微软公司推出的一种面向对象的、运行于.NET Framework之上的高级程序设计语言,它以其强大的类型系统、简洁的语法和对.NET库的深度...

    JS前台加密,java后台解密实现

    这是因为用户直接在前端输入的信息如果不加密,可能会在传输过程中被嗅探或篡改。JavaScript提供了多种加密库和算法来实现这一目标,例如使用AES(高级加密标准)、RSA(公钥加密技术)或MD5(消息摘要算法5)等。 ...

    GET请求https,post请求https

    在互联网通信中,HTTPS(Hypertext Transfer Protocol Secure)是一种基于HTTP协议的安全版本,主要用于确保数据传输过程中的安全性。HTTPS通过使用SSL/TLS协议来加密通信,保护用户隐私和数据完整性,防止中间人...

    C#操作cookie,解密加密cookie

    这通常发生在接收到来自服务器的响应时,我们需要保存这些Cookie以便后续请求使用。 #### 3. Cookie的序列化与反序列化 为了能够存储或在网络上传输`CookieContainer`,代码中使用了`ObjectToBytes`和`...

    国密SM4算法前后端加密解密完整代码.zip

    后端代码则可能包括一个主类,用于处理接收到的请求,进行加密解密操作,并将结果返回给前端。 在实际应用中,还需要考虑安全性问题,比如密钥管理、通信过程中的密钥交换、防止中间人攻击等。同时,为了保证数据...

    URL参数加密解密(java版)

    在Java开发中,URL参数加密解密是网络安全的重要环节,特别是在J2EE应用程序中,确保数据传输的安全性至关重要。URL参数通常包含用户敏感信息,如登录凭证、交易详情等,因此需要进行加密处理以防止数据在传输过程中...

    https原理:证书传递、验证和数据加密、解密过程解析

    1. **客户端发起HTTPS请求**:用户在浏览器中输入HTTPS网址并连接到服务器的443端口,这是HTTPS默认的通信端口。 2. **服务端的配置**:服务器需要一个数字证书,通常由权威的证书颁发机构(CA)签发,用于证明...

    aes、ras,前端js加密,后端java解密

    2. **通信**:加密后的数据通过HTTP请求发送到服务器,由于是RSA加密,数据在传输过程中相对安全。 3. **后端**:Java服务器接收到数据后,使用`RSACoder.java`中的私钥解密RSA加密的数据,得到AES密钥。 4. **解密*...

    前后端加解密.rar

    前端部分,压缩包中包含了一个名为"AES前端解密js.zip"的文件,这通常是一个JavaScript库,用于在浏览器环境中实现AES解密。在前端进行数据解密可以防止数据在传输过程中被未授权的第三方获取,因为加密的数据在发送...

    Postman利用forgeJS实现RSA加解密.zip

    ForgeJS则是一个JavaScript库,提供了包括RSA在内的多种加密算法,可以在浏览器环境中进行加解密操作。本教程将介绍如何在Postman中利用ForgeJS库来实现RSA加解密。 首先,我们需要理解RSA加密的基本原理。RSA是由...

    java前后端通讯AES加密及解密样例

    `generateKey`方法创建了一个AES密钥,这里的密钥是硬编码的,实际应用中应将其存储在安全的地方,并确保在生产环境中不被泄露。 在前端,通常使用JavaScript进行交互,可以通过Ajax请求将加密后的数据发送到后端。...

    白帽子讲浏览器安全.钱文祥(带详细书签).pdf

    本书从攻击者常用技巧的“表象”深入介绍浏览器的具体实现方式,让你在知其然的情况下也知其所以然。 第1篇 初探浏览器安全 1 1 漏洞与浏览器安全 3 1.1 漏洞的三要素 3 1.2 漏洞的生命周期 4 1.3 浏览器安全...

    JavaScript 压缩 加密 解密

    JavaScript是一种广泛应用于Web开发的脚本语言,它在浏览器端执行,为网页添加交互性。在JavaScript中,压缩、加密和解密是重要的安全实践,用于保护数据的隐私和优化资源加载速度。以下是对这些概念的详细解释: *...

    python爬虫 - js逆向之猿人学第三题请求顺序验证+请求头验证.pdf

    在猿人学的这个特定问题中,JavaScript代码的混淆部分可能涉及到一个解密或计算的过程,我们需要解码那些看似随机的数字和字符序列。这可能涉及到位运算、字符串操作和可能的加密算法。一旦我们理解了这个过程,就...

    用Wireshark简单分析HTTPS传输过程-抓包过程 - manjingliu的编程之旅 - CSDN博客1

    - 客户端(浏览器)向服务器发送一个“Client Hello”消息,其中包含支持的SSL/TLS版本信息、加密套件列表、随机数等。 - 服务器回应“Server Hello”消息,选择一个共同支持的版本和加密套件,并发送服务器证书,...

    ASP代码解密,95%的ASP代码都能解

    总的来说,ASP代码解密是一个复杂的过程,涉及到技术技能和法律考量。对于开发者而言,了解这些概念和方法可以帮助他们在维护和更新旧的、加密的ASP项目时更加得心应手。同时,这也提醒我们在编写代码时要考虑到安全...

    使用wireshark 抓取并解密https分析报告

    1. **初始化阶段**:客户端生成一个随机数,并将其与支持的协议版本、加密算法和压缩算法一起封装在`ClientHello`消息中发送给服务器。服务器接收到这些信息后,会在`ServerHello`消息中确认所选的协议版本、加密...

    黑狼asp解密器asp解密器

    它允许开发者在HTML代码中嵌入VBScript或JScript等脚本语言,服务器在接收到客户端请求时执行这些脚本,然后将结果返回给浏览器。然而,出于安全考虑,ASP源代码通常会被加密,防止未经授权的访问和复制。 "黑狼asp...

Global site tag (gtag.js) - Google Analytics