概述
本指南旨在提供一个如何使用HttpClient的一个入门指南,完成此教程后,你将能够使用HttpClient编写一个下载页面的简单例子。我们假定你已经了解如何用java编程,并且熟悉你所有使用的开发环境。
准备
第一,获取HttpClient以及HttpClient的相关依赖包,本教程为HttpClient3.0编写的,需JDK1.3或以上版本。
第二,把下载的HttpClient及其依赖包加入到类路径中。在JSSE使用HTTS连接,还需要一个可选的依赖;在此教程中并不是必须的。
概念
使用HttpClient的一般流程包括如下步骤:
1,创建HttpClient的实例
2,创建方法(Method)的实例(在本教程中是GetMethod).连接的URL作为构造方法的参数。
3,HttpClient执行这个方法(Method)。
4,读取响应。
5,释放连接。
6,处理响应。
本教程包括了如何完成以上所示的步骤,请注意,我们关注HttpClient整个流程但是忽略服务端返回错误的情况,但是这非常重要是因为HTTP1.1允许同一个连接多次请求,只需要一个接着一个发送请求即可。很显然,如果我们不能在第一请求中读取整个响应,那么余下的数据将会影响第二个响应HttpClient试图去处理以避免这样的问题,记得总是释放连接是非常的重要的。
释放连接才能够确保HttpClient连接的重复利用。
总是关闭连接而不管服务器放回错误与否是非常重要的。
实例化HttpClinet
HttpClient无参的构造方法为大多数情况提供了一个适当的默认的设置参数,以方便我们的使用。
HttpClient client = new HttpClient();
创建Method
HTTP规范定义的各种方法与HttpClient实现了HttpMethod接口的类对应。这些类都可以在org.apache.commons.httpclient.methods包中找到
我们使用Get方法,通过URL获取URL关联的文档的简单的方法。
HttpMethod method = new GetMethod("http://www.apache.org/");
执行方法
方法的实际执行是通过调用Client的executeMethod方法,并以Method作为参数。因为网络连接是不可靠的,所以我们需要处理发生的任何错误。
在执行executeMethod方法可能会抛出两种类型的异常:HttpException and IOException.
另外一个有用的信息为服务器返回的状态码,在执行executeMethod方法以int类型返回,它能用于确定请求成功还是失败,有时候也用来指明客户端是否需要下一步的工作,比如提供身份认证凭证。
HttpException
HttpException 代表一个逻辑错误,当请求无法发出或是响应的不能处理导致HTTP规范中定义的致命的冲突。通常这种异常是无法恢复的。有关协议异常的详细讨论请参考HttpClient异常处理指南。
注意,HttpException实际继承自IOException,你可以忽略它而只捕获IOException,在应用程序不区分协议和传输异常的情况下。
IOException
原始IOException代表了一个传输错误,类似如IO已关闭时,错误将会抛出。通常请求还有可能在第二次尝试中成功,HttpClient尝试自动恢复请求。有关传输异常的详细讨论请参考HttpClient异常处理指南。
Method恢复
默认的HttpClient将会自动尝试从非致命的错误的恢复,也就是说,当一个IOException 抛出时。HttpClient将会重试执行方法三次只要请求未完全到达服务器。就是Http method恢复的详细讨论请参考HttpClient异常处理指南
// set per default
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, new DefaultHttpMethodRetryHandler());
默认的恢复处理能够实现自定义,可以增加自动重试的次数,即使客户端请求被服务器处理,HttpClient还是可以去执行方法,只是当接受响应时,将会抛出IOException异常。开启方法自动恢复时,请慎重。只有已知method是幕等方法的,也就是说,多次重试不会导致数据损坏或是不一致。
经验是GET method通常是安全的,而实体包含Method像POST,PUT通常是不安全的。
DefaultMethodRetryHandler retryhandler = new DefaultMethodRetryHandler(10, true);
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, retryhandler);
读取响应
不管服务端返回的状态,总是去读取响应体是非常重要的。请看下面三种读取方法:
调用method.getResponseBody(). 这将返回一个包含响应正文中的数据的字节数组。
调用method.getResponseBodyAsString()。返回包含响应正文的字符串。警告:字节转换成字符串使用默认的编码,所以此方法可能不能在多个平台上移植。
调用method.getResponseBodyAsStream()读取整个内容流后调用stream.close()。处理接受缓冲至文件或者读取处理的大量数据是最合适的。在读取整个流之后,记得关闭输入流。
在指南中,为了简单,我们使用了getResponseBody()
byte[] responseBody = method.getResponseBody();
释放连接
这是让HttpClient持续运行的关键的一步,我们必须告诉HttpClient已经使用完连接,能够回收了。如果没有关闭连接,HttpClient将会无限期的等待连接的释放,来重用它。
method.releaseConnection();
处理响应
现在完成了与HttpClient的交互,我们专注于处理需要的数据。在例子中,我们将直接打印到控制台。在我们需要读取返回的响应流情况下,我们就需要特别注意了。读取需要结合连接使用,当我们处理完所有的数据,就可以关闭输入流并释放连接。
注意,这里我们应该重视字符编码来代替系统默认。
System.out.println(new String(responseBody));
最终代码
用相关代码组合以上所有的代码片段,我们得到了下面的例子:
import org.apache.commons.httpclient.*;
import org.apache.commons.httpclient.methods.*;
import org.apache.commons.httpclient.params.HttpMethodParams;
import java.io.*;
public class HttpClientTutorial {
private static String url = "http://www.apache.org/";
public static void main(String[] args) {
// Create an instance of HttpClient.
HttpClient client = new HttpClient();
// Create a method instance.
GetMethod method = new GetMethod(url);
// Provide custom retry handler is necessary
method.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,
new DefaultHttpMethodRetryHandler(3, false));
try {
// Execute the method.
int statusCode = client.executeMethod(method);
if (statusCode != HttpStatus.SC_OK) {
System.err.println("Method failed: " + method.getStatusLine());
}
// Read the response body.
byte[] responseBody = method.getResponseBody();
// Deal with the response.
// Use caution: ensure correct character encoding and is not binary data
System.out.println(new String(responseBody));
} catch (HttpException e) {
System.err.println("Fatal protocol violation: " + e.getMessage());
e.printStackTrace();
} catch (IOException e) {
System.err.println("Fatal transport error: " + e.getMessage());
e.printStackTrace();
} finally {
// Release the connection.
method.releaseConnection();
}
}
}
分享到:
相关推荐
本教程将全面介绍HttpClient的入门知识,帮助初学者理解其核心概念和用法。 1. **HttpClient简介** ... 2. **安装与配置** ...通过阅读提供的"HttpClient入门.pdf"文件,将更深入地了解HttpClient的使用方法和技巧。
### Google Android 开发入门指南(第二版)知识点总结 #### 一、书籍基本信息与作者介绍 - **书名**:《Google Android 开发入门指南》第二版 - **作者**:Mark L. Murphy 编著;王世江 改编 - **出版时间**:2009...
这个标题"HttpClient中文文档,快速开发"表明我们有了一份关于HttpClient的中文版使用指南,对于快速理解和应用HttpClient进行开发来说非常有价值。 HttpClient允许开发者执行各种HTTP方法,如GET、POST、PUT、...
- `README.txt`:一般提供了项目的简介和快速入门指南。 - `NOTICE.txt`:通常列出库中可能包含的第三方组件及其许可信息。 在实际项目中,开发者可以使用HttpClient 3.1进行如下操作: 1. **发送GET请求**:获取...
`README.txt`可能包含项目的简介和快速入门指南;`NOTICE.txt`列出了一些法律注意事项和第三方库的版权信息;`lib`目录则包含了HttpClient运行所需的依赖库。 总之,HttpClient是Java开发中不可或缺的工具,它提供...
### Google Android 开发入门指南(第三版)知识点总结 #### 一、书籍概述与目标读者 - **书籍名称**:Google Android 开发入门指南(第三版) - **目标读者**:本书面向Android初学者,旨在帮助他们从零基础快速...
Tornado提供了`tornado.httpclient`模块,用于发起HTTP请求。这个模块也支持异步操作,可以在一个请求未完成时发起另一个请求,避免阻塞主线程。 ### 5. 模板引擎 Tornado使用`tornado.template`模块提供模板渲染...
- `HttpClient`和`WebSocket`类实现网络通信。 六、调试与发布 B4A内置了调试工具,你可以通过设置断点、查看变量值来调试代码。完成应用开发后,你可以直接在模拟器或连接的设备上运行测试,最后导出APK文件进行...
整体来看,这份Xamarin Android入门开发指南API调用文档不仅是一份入门指南,它同时提供了足够深入的信息,帮助开发者打造专业的Android应用。对于刚接触Xamarin Android的开发者而言,按照该文档的步骤和指导进行...
1. **快速入门**:指导如何初始化HttpClient,创建请求并发送。 2. **API参考**:列出所有公开的类、接口和方法,解释其用途和用法。 3. **示例代码**:演示常见任务的实现,如GET、POST请求,处理cookies,上传文件...
一个一个上传太累了,又因为权限限制,我尽可能多的放一起上传。...HttpClient入门.pdf ibatis开发指南.pdf Java.Servlets.编程指南.pdf Java2参考大全(第四版)解密.pdf Java2网络协议技术内幕.pdf }
通常,它会包含项目的概述、安装指南、快速入门示例以及如何获取帮助等信息。`RELEASE_NOTES.txt`则详细记录了每个版本的更新内容和改进,这对于跟踪版本变化和解决兼容性问题至关重要。`LICENSE.txt`和`NOTICE.txt`...
### Java菜鸟入门手册知识点概述 ...这些内容不仅适合Java初学者作为入门指南,也为进阶学习打下了坚实的基础。随着对这些知识点的深入学习,读者将能够更好地理解和掌握Java编程,从而在实际项目开发中更加得心应手。
本教程聚焦于使用Java语言构建爬虫,旨在为初学者提供一个入门指南。Java作为一门广泛应用的编程语言,拥有丰富的库和工具,使得构建爬虫变得相对简单。 【描述】: 在Java中编写爬虫,首先需要理解网络请求的基本...
本书的介绍部分会指导读者安装Android 4 SDK,配置开发环境,并对Android Studio的使用提供入门指南。 知识点三:Android应用生命周期 Android应用的生命周期是其运行过程中的一个关键概念,它描述了应用从创建到...
本篇文章旨在为初次接触淘宝OpenAPI的读者提供一份详尽的入门指南,不仅涵盖理论知识,还将通过示例代码帮助理解实际操作流程。 #### 淘宝OpenAPI概述 淘宝OpenAPI,作为阿里巴巴集团旗下的开放接口服务,允许第三...
"网络机器人Java编程指南"这本书作为入门资料,将引导你探索这个领域,理解基本概念,掌握核心技能,并最终实现自己的Java爬虫项目。在阅读过程中,结合实际编码,理论与实践相结合,将大大提升学习效果。
因此,如果您过去曾经使用过CacheCow.Server并且想要迁移,请进一步阅读有关迁移的指南。 CacheCow.Client进行了一些更改,这些更改可能会或可能不会破坏您的代码(取决于您是否使用过.NET 4.5软件包),其中包括:...
【OFBIZ 2.0 入门指南】 OFBIZ是一个开源的电子商务软件系统,它基于Java技术栈,利用诸如Tomcat、Ant、BeanShell和Jboss等优秀开源项目构建了一个强大的商务应用平台。OFBIZ的核心组件是Entity Engine,它提供了...
代码和帖子来自博客:Vue文章 :diamond_with_a_dot: () :camera: () :joker: (来源) 在Fullstack Vue上了解更多信息 角度的 文章 :construction_worker: 服务人员和Angular入门指南(来源) :film_projector:...