`

HttpClient入门指南

阅读更多

概述

本指南旨在提供一个如何使用HttpClient的一个入门指南,完成此教程后,你将能够使用HttpClient编写一个下载页面的简单例子。我们假定你已经了解如何用java编程,并且熟悉你所有使用的开发环境。

 

准备

第一,获取HttpClient以及HttpClient的相关依赖包,本教程为HttpClient3.0编写的,需JDK1.3或以上版本。

第二,把下载的HttpClient及其依赖包加入到类路径中。在JSSE使用HTTS连接,还需要一个可选的依赖;在此教程中并不是必须的。

 

概念

使用HttpClient的一般流程包括如下步骤:

1,创建HttpClient的实例

2,创建方法(Method)的实例(在本教程中是GetMethod).连接的URL作为构造方法的参数。

3,HttpClient执行这个方法(Method)。

4,读取响应。

5,释放连接。

6,处理响应。

本教程包括了如何完成以上所示的步骤,请注意,我们关注HttpClient整个流程但是忽略服务端返回错误的情况,但是这非常重要是因为HTTP1.1允许同一个连接多次请求,只需要一个接着一个发送请求即可。很显然,如果我们不能在第一请求中读取整个响应,那么余下的数据将会影响第二个响应HttpClient试图去处理以避免这样的问题,记得总是释放连接是非常的重要的。

释放连接才能够确保HttpClient连接的重复利用。

总是关闭连接而不管服务器放回错误与否是非常重要的。

 

实例化HttpClinet

HttpClient无参的构造方法为大多数情况提供了一个适当的默认的设置参数,以方便我们的使用。

HttpClient client = new HttpClient();

 

创建Method

HTTP规范定义的各种方法与HttpClient实现了HttpMethod接口的类对应。这些类都可以在org.apache.commons.httpclient.methods包中找到

我们使用Get方法,通过URL获取URL关联的文档的简单的方法。

HttpMethod method = new GetMethod("http://www.apache.org/");

 

执行方法

方法的实际执行是通过调用Client的executeMethod方法,并以Method作为参数。因为网络连接是不可靠的,所以我们需要处理发生的任何错误。

在执行executeMethod方法可能会抛出两种类型的异常:HttpException and IOException.

另外一个有用的信息为服务器返回的状态码,在执行executeMethod方法以int类型返回,它能用于确定请求成功还是失败,有时候也用来指明客户端是否需要下一步的工作,比如提供身份认证凭证。

 

HttpException 

HttpException 代表一个逻辑错误,当请求无法发出或是响应的不能处理导致HTTP规范中定义的致命的冲突。通常这种异常是无法恢复的。有关协议异常的详细讨论请参考HttpClient异常处理指南。

注意,HttpException实际继承自IOException,你可以忽略它而只捕获IOException,在应用程序不区分协议和传输异常的情况下。

 

IOException

原始IOException代表了一个传输错误,类似如IO已关闭时,错误将会抛出。通常请求还有可能在第二次尝试中成功,HttpClient尝试自动恢复请求。有关传输异常的详细讨论请参考HttpClient异常处理指南。

 

Method恢复

默认的HttpClient将会自动尝试从非致命的错误的恢复,也就是说,当一个IOException 抛出时。HttpClient将会重试执行方法三次只要请求未完全到达服务器。就是Http method恢复的详细讨论请参考HttpClient异常处理指南

// set per default
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, new DefaultHttpMethodRetryHandler());

默认的恢复处理能够实现自定义,可以增加自动重试的次数,即使客户端请求被服务器处理,HttpClient还是可以去执行方法,只是当接受响应时,将会抛出IOException异常。开启方法自动恢复时,请慎重。只有已知method是幕等方法的,也就是说,多次重试不会导致数据损坏或是不一致。

经验是GET method通常是安全的,而实体包含Method像POST,PUT通常是不安全的。

 

DefaultMethodRetryHandler retryhandler = new DefaultMethodRetryHandler(10, true);
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, retryhandler);

 

读取响应

不管服务端返回的状态,总是去读取响应体是非常重要的。请看下面三种读取方法:

调用method.getResponseBody(). 这将返回一个包含响应正文中的数据的字节数组。

调用method.getResponseBodyAsString()。返回包含响应正文的字符串。警告:字节转换成字符串使用默认的编码,所以此方法可能不能在多个平台上移植。

调用method.getResponseBodyAsStream()读取整个内容流后调用stream.close()。处理接受缓冲至文件或者读取处理的大量数据是最合适的。在读取整个流之后,记得关闭输入流。

在指南中,为了简单,我们使用了getResponseBody()

byte[] responseBody = method.getResponseBody();

 

释放连接

这是让HttpClient持续运行的关键的一步,我们必须告诉HttpClient已经使用完连接,能够回收了。如果没有关闭连接,HttpClient将会无限期的等待连接的释放,来重用它。 

method.releaseConnection();

 

处理响应

现在完成了与HttpClient的交互,我们专注于处理需要的数据。在例子中,我们将直接打印到控制台。在我们需要读取返回的响应流情况下,我们就需要特别注意了。读取需要结合连接使用,当我们处理完所有的数据,就可以关闭输入流并释放连接。

注意,这里我们应该重视字符编码来代替系统默认。

System.out.println(new String(responseBody));

最终代码
用相关代码组合以上所有的代码片段,我们得到了下面的例子:
import org.apache.commons.httpclient.*;
import org.apache.commons.httpclient.methods.*;
import org.apache.commons.httpclient.params.HttpMethodParams;

import java.io.*;

public class HttpClientTutorial {
  
  private static String url = "http://www.apache.org/";

  public static void main(String[] args) {
    // Create an instance of HttpClient.
    HttpClient client = new HttpClient();

    // Create a method instance.
    GetMethod method = new GetMethod(url);
    
    // Provide custom retry handler is necessary
    method.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, 
    		new DefaultHttpMethodRetryHandler(3, false));

    try {
      // Execute the method.
      int statusCode = client.executeMethod(method);

      if (statusCode != HttpStatus.SC_OK) {
        System.err.println("Method failed: " + method.getStatusLine());
      }

      // Read the response body.
      byte[] responseBody = method.getResponseBody();

      // Deal with the response.
      // Use caution: ensure correct character encoding and is not binary data
      System.out.println(new String(responseBody));

    } catch (HttpException e) {
      System.err.println("Fatal protocol violation: " + e.getMessage());
      e.printStackTrace();
    } catch (IOException e) {
      System.err.println("Fatal transport error: " + e.getMessage());
      e.printStackTrace();
    } finally {
      // Release the connection.
      method.releaseConnection();
    }  
  }
}
 

 

分享到:
评论

相关推荐

    HttpClient入门教程全解

    本教程将全面介绍HttpClient的入门知识,帮助初学者理解其核心概念和用法。 1. **HttpClient简介** ... 2. **安装与配置** ...通过阅读提供的"HttpClient入门.pdf"文件,将更深入地了解HttpClient的使用方法和技巧。

    Google Android 开发入门指南(第二版).pdf

    ### Google Android 开发入门指南(第二版)知识点总结 #### 一、书籍基本信息与作者介绍 - **书名**:《Google Android 开发入门指南》第二版 - **作者**:Mark L. Murphy 编著;王世江 改编 - **出版时间**:2009...

    HttpClient中文文档,快速开发

    这个标题"HttpClient中文文档,快速开发"表明我们有了一份关于HttpClient的中文版使用指南,对于快速理解和应用HttpClient进行开发来说非常有价值。 HttpClient允许开发者执行各种HTTP方法,如GET、POST、PUT、...

    org.apache.commons.httpclient-3.1.jar

    - `README.txt`:一般提供了项目的简介和快速入门指南。 - `NOTICE.txt`:通常列出库中可能包含的第三方组件及其许可信息。 在实际项目中,开发者可以使用HttpClient 3.1进行如下操作: 1. **发送GET请求**:获取...

    HttpClient

    `README.txt`可能包含项目的简介和快速入门指南;`NOTICE.txt`列出了一些法律注意事项和第三方库的版权信息;`lib`目录则包含了HttpClient运行所需的依赖库。 总之,HttpClient是Java开发中不可或缺的工具,它提供...

    google android开发入门指南(第三版)(1)英文原版

    ### Google Android 开发入门指南(第三版)知识点总结 #### 一、书籍概述与目标读者 - **书籍名称**:Google Android 开发入门指南(第三版) - **目标读者**:本书面向Android初学者,旨在帮助他们从零基础快速...

    Tornado使用指南(中文版)

    Tornado提供了`tornado.httpclient`模块,用于发起HTTP请求。这个模块也支持异步操作,可以在一个请求未完成时发起另一个请求,避免阻塞主线程。 ### 5. 模板引擎 Tornado使用`tornado.template`模块提供模板渲染...

    Basic4Android初学者指南

    - `HttpClient`和`WebSocket`类实现网络通信。 六、调试与发布 B4A内置了调试工具,你可以通过设置断点、查看变量值来调试代码。完成应用开发后,你可以直接在模拟器或连接的设备上运行测试,最后导出APK文件进行...

    Xamarin Android入门开发指南api调用文档,内容详细

    整体来看,这份Xamarin Android入门开发指南API调用文档不仅是一份入门指南,它同时提供了足够深入的信息,帮助开发者打造专业的Android应用。对于刚接触Xamarin Android的开发者而言,按照该文档的步骤和指导进行...

    httpclientj的jar包和帮助文档下载

    1. **快速入门**:指导如何初始化HttpClient,创建请求并发送。 2. **API参考**:列出所有公开的类、接口和方法,解释其用途和用法。 3. **示例代码**:演示常见任务的实现,如GET、POST请求,处理cookies,上传文件...

    Java电子书打包-4

    一个一个上传太累了,又因为权限限制,我尽可能多的放一起上传。...HttpClient入门.pdf ibatis开发指南.pdf Java.Servlets.编程指南.pdf Java2参考大全(第四版)解密.pdf Java2网络协议技术内幕.pdf }

    httpcomponents-client-5.1-bin.zip

    通常,它会包含项目的概述、安装指南、快速入门示例以及如何获取帮助等信息。`RELEASE_NOTES.txt`则详细记录了每个版本的更新内容和改进,这对于跟踪版本变化和解决兼容性问题至关重要。`LICENSE.txt`和`NOTICE.txt`...

    Java菜鸟入门手册

    ### Java菜鸟入门手册知识点概述 ...这些内容不仅适合Java初学者作为入门指南,也为进阶学习打下了坚实的基础。随着对这些知识点的深入学习,读者将能够更好地理解和掌握Java编程,从而在实际项目开发中更加得心应手。

    java爬虫.7z

    本教程聚焦于使用Java语言构建爬虫,旨在为初学者提供一个入门指南。Java作为一门广泛应用的编程语言,拥有丰富的库和工具,使得构建爬虫变得相对简单。 【描述】: 在Java中编写爬虫,首先需要理解网络请求的基本...

    Android+4编程入门经典

    本书的介绍部分会指导读者安装Android 4 SDK,配置开发环境,并对Android Studio的使用提供入门指南。 知识点三:Android应用生命周期 Android应用的生命周期是其运行过程中的一个关键概念,它描述了应用从创建到...

    淘宝API开发文档

    本篇文章旨在为初次接触淘宝OpenAPI的读者提供一份详尽的入门指南,不仅涵盖理论知识,还将通过示例代码帮助理解实际操作流程。 #### 淘宝OpenAPI概述 淘宝OpenAPI,作为阿里巴巴集团旗下的开放接口服务,允许第三...

    网络机器人Java编程指南.

    "网络机器人Java编程指南"这本书作为入门资料,将引导你探索这个领域,理解基本概念,掌握核心技能,并最终实现自己的Java爬虫项目。在阅读过程中,结合实际编码,理论与实践相结合,将大大提升学习效果。

    CacheCow:在.NET Core和4.5.2+中为客户端和服务器实现HTTP缓存的实现

    因此,如果您过去曾经使用过CacheCow.Server并且想要迁移,请进一步阅读有关迁移的指南。 CacheCow.Client进行了一些更改,这些更改可能会或可能不会破坏您的代码(取决于您是否使用过.NET 4.5软件包),其中包括:...

    OFBIZ2.0 入门手册,适合刚学习的朋友们

    【OFBIZ 2.0 入门指南】 OFBIZ是一个开源的电子商务软件系统,它基于Java技术栈,利用诸如Tomcat、Ant、BeanShell和Jboss等优秀开源项目构建了一个强大的商务应用平台。OFBIZ的核心组件是Entity Engine,它提供了...

    awesome-fullstack-tutorials:很棒的全栈教程

    代码和帖子来自博客:Vue文章 :diamond_with_a_dot: () :camera: () :joker: (来源) 在Fullstack Vue上了解更多信息 角度的 文章 :construction_worker: 服务人员和Angular入门指南(来源) :film_projector:...

Global site tag (gtag.js) - Google Analytics