`
yang_min
  • 浏览: 343000 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

HttpClient 学习

    博客分类:
  • J2EE
阅读更多
今天学习HttpClient对HTTP方法的支持。
  "方法"这个词的含义太丰富了,在学习之前先交待一下。首先,每个类中有方法,与属性相对,可以视作函数,为区分称之”类方法“;HTML语言的表单(FORM)中也定义了方法(method),常见的是GET和POST,用以指明表单中输入的数据上传服务器的方法,称之为”HTML方法“;HTTP协议中也有方法,可视作http客户端向服务器端发送的指令(至于服务器端收到指令后执行不执行或如何执行那是另一码事),称之为HTTP方法。
  前几篇HttpClient笔记中,我对方法这个词没有根据上下文做细致的说明,估计难为了那些看笔记的朋友了。:)


  HttpClient支持的HTTP方法有8种,下面分述之。


1、Options

  HTTP方法Options用来向服务器发送请求,希望获得针对由请求URL(request url)标志的资源在请求/应答的通信过程可以使用的功能选项。通过这个方法,客户端可以在采取具体行动之前,就可对某一资源决定采取什么动作和/或以及一些必要条件,或者了解服务器提供的功能。这个方法最典型的应用,就是用来获取服务器支持哪些HTTP方法。
  HttpClient中有一个类叫OptionsMethod,来支持这个HTTP方法,利用这个类的getAllowedMethods方法,就可以很简单地实现上述的典型应用。

OptionsMethod options = new OptionsMethod("http://jakarta.apache.org");
// 执行方法并做相应的异常处理
...
Enumeration allowedMethods = options.getAllowedMethods();
options.releaseConnection();


2、Get

HTTP方法GET用来取回请求URI(request-URI)标志的任何信息(以实体(entity)的形式),"get"这个单词本意就是”获取“的意思。如果请求URI指向的一个数据处理过程,那这个过程生成的数据,在应答中以实体的形式被返回,而不是将这个过程的代码的返回。
  如果HTTP包中含有If-ModifiedSince, If-Unmodified-Since, If-Match, If-None-Match, 或 If-Range等头字段,则GET也就变成了”条件GET“,即只有满足上述字段描述的条件的实体才被取回,这样可以减少一些非必需的网络传输,或者减少为获取某一资源的多次请求(如第一次检查,第二次下载)。(一般的浏览器,都有一个临时目录,用来缓存一些网页信息,当再次浏览某个页面的时候,只下载那些修改过的内容,以加快浏览速度,就是这个道理。至于检查,则常用比GET更好的方法HEAD来实现。)如果HTTP包中含有Range头字段,那么请求URI指定的实体中,只有决定范围条件的那部分才被取回来。(用过多线程下载工具的朋友,可能比较容易理解这一点)
  这个方法的典型应用,用来从web服务器下载文档。HttpClient定义了一个类叫GetMethod来支持这个方法,用GetMethod类中getResponseBody, getResponseBodyAsStream 或 getResponseBodyAsString函数就可以取到应答包包体中的文档(如HTML页面)信息。这这三个函数中,getResponseBodyAsStream通常是最好的方法,主要是因为它可以避免在处理下载的文档之前缓存所有的下载的数据。

GetMethod get = new GetMethod("http://jakarta.apache.org");
// 执行方法,并处理失败的请求.
...
InputStream in = get.getResponseBodyAsStream();
// 利用输入流来处理信息。
get.releaseConnection();

  对GetMethod的最常见的不正确的使用,是没有将全部的应答主体的数据读出来。还有,必须注意要手工明确地将链接释放。

3、Head

  HTTP的Head方法,与Get方法完全一致,唯一的差别是服务器不能在应答包中包含主体(message-body),而且一定不能包含主体。使用这个方法,可以使得客户无需将资源下载回就可就以得到一些关于它的基本信息。这个方法常用来检查超链的可访问性以及资源最近有没有被修改。
  HTTP的head方法最典型的应用,是获取资源的基本信息。HttpClient定义了HeadMethod类支持这个方法,HeadMethod类与其它*Method类一样,用 getResponseHeaders()取回头部信息,而没有自己的特殊方法。

HeadMethod head = new HeadMethod("http://jakarta.apache.org");
// 执行方法,并处理失败的请求.
...
// 取回应答包的头字段信息.
Header[] headers = head.getResponseHeaders();

// 只取回最后修改日期字段的信息.
String lastModified = head.getResponseHeader("last-modified").getValue();



4、Post

  Post在英文有“派驻”的意思,HTTP方法POST就是要求服务器接受请求包中的实体,并将其作为请求URI的下属资源。从本质上说,这意味着服务器要保存这个实体信息,而且通常由服务器端的程序进行处理。Post方法的设计意图,是要以一种统一的方式实现下列功能:
对已有的资源做评注

将信息发布到BBS、新闻组、邮件列表,或类似的文章组中

将一块数据,提交给数据处理进程

通过追加操作,来扩展一个数据库
这些都操作期待着在服务器端产生一定的“副作用”,如修改了数据库等。
  HttpClient定义PostMethod类以支持该HTTP方法,在httpclient中,使用post方法有两个基本的步骤:为请求包准备数据,然后读取服务器来的应答包的信息。通过调用 setRequestBody()函数,来为请求包提供数据,它可以接收三类参数:输入流、名值对数组或字符串。至于读取应答包需要调用 getResponseBody* 那一系列的方法,与GET方法处理应答包的方法相同。
  常见问题是,没有将全部应答读取(无论它对程序是否有用),或没有释放链接资源。
分享到:
评论

相关推荐

    java-HttpClient学习,和解析html.zip

    java_HttpClient学习,和解析htmljava_HttpClient学习,和解析html java_HttpClient学习,和解析htmljava_HttpClient学习,和解析html java_HttpClient学习,和解析htmljava_HttpClient学习,和解析html java_...

    HttpClient 学习精髓

    ### HttpClient学习精髓 #### 一、简介 HttpClient是Apache Jakarta Common下的一个子项目,它为开发者提供了高效、最新的以及功能丰富的支持HTTP协议的客户端编程工具包。HttpClient支持HTTP协议的最新版本及相关...

    HtmlParser和HttpClient学习资料

    在提供的压缩包“HtmlParser和HttpClient学习资料”中,可能包含以下内容: - HTML和HTTP基础教程:帮助初学者了解这两个主题的基本概念。 - HtmlParser库的API文档和示例代码:展示如何使用特定的HtmlParser库进行...

    httpclient学习

    《HttpClient学习详解》 HttpClient是Apache软件基金会的 HttpClient项目提供的一款强大的HTTP客户端API,它允许开发者在Java应用程序中实现复杂的HTTP通信。HttpClient以其丰富的功能、灵活性和可扩展性,广泛应用...

    HttpClient学习笔记

    ### HttpClient学习笔记知识点详解 #### 一、HttpClient简介与特点 **HttpClient** 是 Apache Commons 库中的一个子项目,主要用于简化 Java 程序与 Web 服务器之间的 HTTP 交互过程。相较于使用 `java.net` 包...

    HttpClient学习总结.docx

    HttpClient 3.1需要依赖commons-httpclient-3.1.jar、commons-logging.jar和commons-codec.jar这些jar包,而HttpClient 4.x的最新版本为4.1.2,官方不再维护3.x版本。HttpClient 4.x的jar包可以在Apache官方网站上...

    httpClient学习.doc

    ### HttpClient入门详解 #### 一、概述 `HttpClient` 是 Apache Jakarta Commons 下的一个子项目,提供了高效、功能丰富且遵循最新 HTTP 协议规范的客户端编程工具包。它支持 HTTP 协议的所有主流版本和特性,是...

    HttpClient学习笔记参考.pdf

    6. **连接管理**: HttpClient 内置了连接管理器,可以控制并发连接的数量,自动检测并关闭失效连接,适应多线程应用。 7. **持久连接**:支持HTTP/1.0的KeepAlive和HTTP/1.1的持久连接,提高效率。 8. **直接访问...

    HttpClient学习资料及用到的jar包

    在学习HttpClient时,首先需要了解它的基本概念和组件。HttpClient主要包括以下几个核心部分: 1. **HttpClient实例**:这是执行HTTP请求的基础。创建HttpClient实例后,可以设置各种配置参数,如连接超时、重试...

    HttpClient_学习整理.

    ### HttpClient 学习整理 #### 一、简介 `HttpClient`是Apache Jakarta Commons下的一个子项目,用于提供高效、最新及功能丰富的HTTP客户端编程工具包。对于那些希望通过HTTP协议访问网络资源的Java应用程序而言,...

    java_HttpClient学习,和解析html.zip

    html 学习资料 项目资料 项目源码 供学习参考 html 学习资料 项目资料 项目源码 供学习参考 html 学习资料 项目资料 项目源码 供学习参考 html 学习资料 项目资料 项目源码 供学习参考 html 学习资料 项目资料 项目...

    httpClient4.1入门教程.pdf

    在本文档中,首先对HttpClient进行了简介,提到了它属于Apache Jakarta Common项目下的子项目,强调了其功能丰富和高效的特点。接着,文档列出了HttpClient的基本功能和特性,包括实现了HTTP协议的多个版本,支持...

    HttpClient入门

    HttpClient入门的学习资料将引领你深入理解这个库的使用方法和核心概念。以下是对HttpClient的详细介绍,以及如何开始使用它。 一、HttpClient简介 HttpClient是Apache基金会下的一个开源项目,它提供了一套强大的...

    HttpClient 学习笔记

    HttpClient 特别强调了在多线程环境中的连接管理和性能优化,能够处理代理、SSL/TLS 安全连接、认证以及文件上传等功能。 在使用 HttpClient 之前,可能需要进行一些预备工作。例如,如果你的 JRE 版本是 1.3.* ...

    HttpClient3.1 学习整理

    HttpClient httpClient = new HttpClient(); GetMethod getMethod = new GetMethod("http://example.com"); int statusCode = httpClient.executeMethod(getMethod); if (statusCode == 200) { System.out....

    httpclient4.5源码学习

    总结,HttpClient 4.5 是一款强大且灵活的 HTTP 客户端库,其源码结构清晰,设计模式巧妙,通过深入学习和实践,开发者可以更好地利用它来实现高效、安全的网络通信。理解 HttpClient 4.5 的源码,不仅有助于我们...

Global site tag (gtag.js) - Google Analytics