对于HTTP协议,向服务器请求某个文件时,只要发送类似如下的请求即可:
GET /Path/FileName HTTP/1.0
Host: www.caiban.net:80
Accept: */*
User-Agent: GeneralDownloadApplication
Connection: close
每行用一个“回车换行”分隔,末尾再追加一个“回车换行”作为整个请求的结束。
第一行中的GET是HTTP协议支持的方法之一,方法名是大小写敏感的,HTTP协议还支持OPTIONS、HAED、POST、PUT、DELETE、TRACE、CONNECT等方法,而GET和HEAD这两个方法通常被认为是“安全的”,也就是说任何实现了HTTP协议的服务器程序都会实现这两个方法。对于文件下载功能,GET足矣。GET后面是一个空格,其后紧跟的是要下载的文件从WEB服务器根开始的绝对路径。该路径后又有一个空格,然后是协议名称及协议版本。 除第一行以外,其余行都是HTTP头的字段部分。Host字段表示主机名和端口号,如果端口号是默认的80则可以不写。Accept字段中的*/*表示接收任何类型的数据。User-Agent表示用户代理,这个字段可有可无,但强烈建议加上,因为它是服务器统计、追踪以及识别客户端的依据。Connection字段中的close表示使用非持久连接。 关于HTTP协议更多的细节可以参考RFC2616(HTTP 1.1)。因为我只是想通过HTTP协议实现文件下载,所以也只看了一部分,并没有看全。 如果服务器成功收到该请求,并且没有出现任何错误,则会返回类似下面的数据:
HTTP/1.0 200 OK
Content-Length: 13057672 Content-Type: application/octet-stream
Last-Modified: Wed, 10 Oct 2005 00:56:34 GMT
Accept-Ranges: bytes
ETag: "2f38a6cac7cec51:160c"
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Wed, 16 Nov 2005 01:57:54 GMT
Connection: close
不用逐一解释,很多东西一看几乎就明白了,只说我们大家都关心内容吧。
第一行是协议名称及版本号,空格后面会有一个三位数的数字,是HTTP协议的响应状态码,200表示成功,OK是对状态码的简短文字描述。状态码共有5类:1xx属于通知类;2xx属于成功类;3xx属于重定向类;4xx属于客户端错误类;5xx属于服务端错误类。对于状态码,相信大家对404应该很熟悉,如果向一个服务器请求一个不存在的文件,就会得到该错误,通常浏览器也会显示类似“HTTP 404 - 未找到文件”这样的错误。Content-Length字段是一个比较重要的字段,它标明了服务器返回数据的长度,这个长度是不包含HTTP头长度的。换句话说,我们的请求中并没有Range字段(后面会说到),表示我们请求的是整个文件,所以Content-Length就是整个文件的大小。其余各字段是一些关于文件和服务器的属性信息。
这段返回数据同样是以最后一行的结束标志(回车换行)和一个额外的回车换行作为结束,即“\r\n\r\n”。而“\r\n\r\n”后面紧接的就是文件的内容了,这样我们就可以找到“\r\n\r\n”,并从它后面的第一个字节开始,源源不断的读取,再写到文件中了。
以上就是通过HTTP协议实现文件下载的全过程。但还不能实现断点续传,而实际上断点续传的实现非常简单,只要在请求中加一个Range字段就可以了。 假如一个文件有1000个字节,那么其范围就是0-999,则: Range: bytes=500- 表示读取该文件的500-999字节,共500字节。 Range: bytes=500-599 表示读取该文件的500-599字节,共100字节。 Range还有其它几种写法,但上面这两种是最常用的,对于断点续传也足矣了。如果HTTP请求中包含Range字段,那么服务器会返回206(Partial Content),同时HTTP头中也会有一个相应的Content-Range字段,类似下面的格式:
Content-Range: bytes 500-999/1000
Content-Range字段说明服务器返回了文件的某个范围及文件的总长度。这时Content-Length字段就不是整个文件的大小了,而是对应文件这个范围的字节数,这一点一定要注意。
一切好像基本上没有什么问题了,本来我也是这么认为的,但事实并非如此。如果我们请求的文件的URL是类似http://www.server.com/filename.exe这样的文件,则不会有问题。但是很多软件下载网站的文件下载链接都是通过程序重定向的,比如pchome的ACDSee的HTTP下载地址是:
http://download.pchome.net/php/tdownload2.php?sid=5547&url=/multimedia/viewer/acdc31sr1b051007.exe&svr=1&typ=0
这种地址并没有直接标识文件的位置,而是通过程序进行了重定向。如果向服务器请求这样的URL,服务器就会返回302(Moved Temporarily),意思就是需要重定向,同时在HTTP头中会包含一个Location字段,Location字段的值就是重定向后的目的URL。这时就需要断开当前的连接,而向这个重定向后的服务器发请求。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/x03570227/archive/2008/01/03/2012372.aspx
分享到:
相关推荐
### Http下载原理详解 #### 一、HTTP下载基础概念 HTTP (Hypertext Transfer Protocol) 是互联网上应用最为广泛的一种网络协议,它主要用于规范客户端(如浏览器)与服务器之间的通信方式。HTTP 协议允许客户端从...
HTTP下载限速原理,简单易懂,通俗明理,让你认识整个过程
### 文库下载原理详解 随着互联网技术的发展与普及,网络上的各类资源变得异常丰富,其中文库类资源因其丰富的信息量而受到了广泛的关注。对于学习和研究者来说,文库内的文档往往包含了宝贵的知识和信息,然而很多...
HTTP(超文本传输协议)是互联网上应用最为广泛的一种网络协议,用于从万维网服务器传输超文本到本地浏览器的传输协议。...同时,对于开发者来说,理解HTTP下载原理也有助于优化网站性能,提供更好的用户体验。
1. **HTTP下载原理**: HTTP(超文本传输协议)是互联网上应用最广泛的一种网络协议,用于从Web服务器传输数据到客户端。在QT中,我们可以使用QNetworkAccessManager类来发起HTTP请求,获取文件。 2. **...
1. HTTP下载原理: - HTTP GET请求:当用户点击下载链接时,浏览器向服务器发送一个HTTP GET请求,请求指定的资源。 - 服务器响应:服务器接收到请求后,找到对应的文件并将其内容作为响应的主体返回给客户端。 -...
总的来说,Bt的下载原理建立在协作和公平的基础上,利用P2P技术将用户连接在一起,共同分发文件,从而实现了高效、可靠的文件共享。了解这些原理有助于我们更好地理解和使用Bt下载,同时也有助于提升网络效率和用户...
FTP(File Transfer Protocol),是文件传输协议的简称。用于Internet上的控制文件的双向传输。同时,它也是一个应用程序(Application)。用户可 以通过它把自己的PC机与世界各地所有运行FTP协议的服务器相连,访问...
HTTP(超文本传输协议)是互联网上应用最广泛的一种网络协议,它定义了客户端(通常是...了解和掌握HTTP协议原理对于开发和调试Web应用至关重要。随着技术的发展,HTTP也在不断演进,以适应更加复杂和高效的需求。
首先,理解HTTP下载的基本原理是至关重要的。HTTP(超文本传输协议)是互联网上应用最为广泛的一种网络协议,用于从Web服务器传输数据到客户端。在PowerBuilder中,我们可以利用其内置的网络库或第三方库来实现HTTP...
【标题】:“蜘蛛原理,下载” 【描述】:“htmldown.rar,蜘蛛原理,下载”这一描述提及的是一个关于“蜘蛛原理”(也称为网络爬虫或网页抓取)的教程资源,它被封装在名为“htmldown.rar”的压缩文件中,并且与...
在Android开发中,多线程下载原理是提升应用程序性能和用户体验的重要技术之一。尤其是在处理大文件,如视频、音频或大型应用更新时,多线程下载可以显著提高下载速度,减少用户等待时间,并且能够更好地利用网络...
里面有详细的下载地址 播放器下载: 暴风影音万能播放器:http://www.99191.com/Soft/VideoTools/videoplayer/200902/2360.html CSF科建播放器:...
在IT行业中,HTTP下载是一种常见的数据传输方式,尤其在客户端-服务器应用中广泛使用。本项目专注于使用C++编程语言实现HTTP下载功能,并且已经封装为一个方便使用的函数。这个函数设计简洁,只需要提供下载地址和...
传统的HTTP下载模式中,数据流是从服务器到客户端的单向传输。服务器的带宽是有限的,当大量用户同时下载时,每个用户的下载速度受到服务器带宽的限制。为了解决这个问题,出现了多线程下载技术,如Flashget(网际...
实验内容可能包括OSI模型的各个层次,如物理层的数据传输,数据链路层的帧封装,网络层的路由选择,传输层的TCP/UDP协议,以及应用层的各种服务如HTTP和FTP等。 "网络实验工具.rar" 可能包含了一系列用于网络实验的...
3. **文件下载原理**:HTTP文件下载通常通过发送GET请求到服务器,服务器响应包含文件内容的HTTP响应。PB应用作为客户端,可以通过建立HTTP连接,发送请求,并接收服务器返回的文件流,然后将其保存到本地。 4. **...