`
m635674608
  • 浏览: 5052335 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

HttpClient4.0 Http连接池技术简介

 
阅读更多

连接池技术作为创建和管理连接的缓冲池技术,目前已广泛用于诸如数据库连接等长连接的维护和管理中,能够有效减少系 统的响应时间,节省服务器资源开销。其优势主要有两个:其一是减少创建连接的资源开销,其二是资源的访问控制。连接池管理的对象是长连接,对于HTTP连 接是否适用,我们需要首先回顾一下长连接和短连接。

       所谓长连接是指客户端与服务器端一旦建立连接以后,可以进行多次数据传输而不需重新建立连接,而短连接则每次数据传输都需要客户端和服务器端建立一次连 接。长连接的优势在于省去了每次数据传输连接建立的时间开销,能够大幅度提高数据传输的速度,对于P2P应用十分适合,但是对于诸如Web网站之类的 B2C应用,并发请求量大,每一个用户又不需频繁的操作的场景下,维护大量的长连接对服务器无疑是一个巨大的考验。而此时,短连接可能更加适用。但是短连 接每次数据传输都需要建立连接,我们知道HTTP协议的传输层协议是TCP协议,TCP连接的建立和释放分别需要进行3次握手和4次握手,频繁的建立连接 即增加了时间开销,同时频繁的创建和销毁Socket同样是对服务器端资源的浪费。所以对于需要频繁发送HTTP请求的应用,需要在客户端使用HTTP长 连接。

        HTTP连 接是无状态的,这样很容易给我们造成HTTP连接是短连接的错觉,实际上HTTP1.1默认即是持久连接,HTTP1.0也可以通过在请求头中设置 Connection:keep-alive使得连接为长连接。既然HTTP协议支持长连接,我们就有理由相信HTTP连接同样需要连接池技术来管理和维 护连接建立和销毁。HTTP Client4.0的ThreadSafeClientConnManager实现了HTTP连接的池化管理,其管理连接的基本单位是Route(路 由),每个路由上都会维护一定数量的HTTP连接。这里的Route的概念可以理解为客户端机器到目标机器的一条线路,例如使用HttpClient的实 现来分别请求 www.163.com 的资源和 www.sina.com 的资源就会产生两个route。缺省条件下对于每个Route,HttpClient仅维护2个连接,总数不超过20个连接,显然对于大多数应用来讲,都 是不够用的,可以通过设置HTTP参数进行调整。

HttpParamsparams=newBasicHttpParams();

//将每个路由的最大连接数增加到200

ConnManagerParams.setMaxTotalConnections(params,200);

// 将每个路由的默认连接数设置为20

ConnPerRouteBean connPerRoute = new ConnPerRouteBean(20);

// 设置某一个IP的最大连接数

HttpHost localhost = new HttpHost("locahost", 80);
connPerRoute.setMaxForRoute(newHttpRoute(localhost),50);
ConnManagerParams.setMaxConnectionsPerRoute(params, connPerRoute);
SchemeRegistry schemeRegistry =newSchemeRegistry();
schemeRegistry.register(
newScheme("http",PlainSocketFactory.getSocketFactory(),80));
schemeRegistry.register(
newScheme("https",SSLSocketFactory.getSocketFactory(),443));
ClientConnectionManager cm =newThreadSafeClientConnManager(params, schemeRegistry);
HttpClient httpClient =newDefaultHttpClient(cm,params);

     可以配置的HTTP参数有:

     1)  http.conn-manager.timeout 当某一线程向连接池请求分配线程时,如果连接池已经没有可以分配的连接时,该线程将会被阻塞,直至http.conn-manager.timeout超时,抛出ConnectionPoolTimeoutException。

     2)  http.conn-manager.max-per-route 每个路由的最大连接数;

     3)  http.conn-manager.max-total 总的连接数;

连接的有效性检测是所有连接池都面临的一个通用问题,大部分HTTP服务器为了控制资源开销,并不会

永久的维护一个长连接,而是一段时间就会关闭该连接。放回连接池的连接,如果在服务器端已经关闭,客

户端是无法检测到这个状态变化而及时的关闭Socket的。这就造成了线程从连接池中获取的连接不一定是有效的。这个问题的一个解决方法就是在每次请求之前检查该连接是否已经存在了过长时间,可能已过期。但是这个方法会使得每次请求都增加额外的开销。HTTP Client4.0的ThreadSafeClientConnManager 提供了

closeExpiredConnections()方法和closeIdleConnections()方法来解决该问题。前一个方法是清除连接池中所有过期的连接,至于连接什么时候过期可以设置,设置方法将在下面提到,而后一个方法则是关闭一定时间空闲的连接,可以使用一个单独的线程完成这个工作。

publicstaticclassIdleConnectionMonitorThreadextendsThread{
privatefinalClientConnectionManager connMgr;
privatevolatileboolean shutdown;
publicIdleConnectionMonitorThread(ClientConnectionManager connMgr){
super();
this.connMgr = connMgr;
}
@Override
publicvoid run(){
try{
while(!shutdown){
synchronized(this){
wait(5000);
// 关闭过期的连接
connMgr.closeExpiredConnections();
// 关闭空闲时间超过30秒的连接
connMgr.closeIdleConnections(30,TimeUnit.SECONDS);
}
}
}catch(InterruptedException ex){
// terminate
}
}
publicvoid shutdown(){
shutdown =true;
synchronized(this){
notifyAll();
}

      刚才提到,客户端可以设置连接的过期时间,可以通过HttpClient的setKeepAliveStrategy方法设置连接的过期时间,这样就可以配合closeExpiredConnections()方法解决连接池中连接失效的。

DefaultHttpClient httpclient =newDefaultHttpClient();
httpclient.setKeepAliveStrategy(newConnectionKeepAliveStrategy(){
publiclong getKeepAliveDuration(HttpResponse response,HttpContext context){
// Honor 'keep-alive' header
HeaderElementIterator it =newBasicHeaderElementIterator(
response.headerIterator(HTTP.CONN_KEEP_ALIVE));
while(it.hasNext()){
HeaderElement he = it.nextElement();
String param = he.getName();
String value = he.getValue();
if(value !=null&& param.equalsIgnoreCase("timeout")){
try{
returnLong.parseLong(value)*1000;
}catch(NumberFormatException ignore){
}
}
}
HttpHost target =(HttpHost) context.getAttribute(
ExecutionContext.HTTP_TARGET_HOST);
if("www.163.com".equalsIgnoreCase(target.getHostName())){
// 对于163这个路由的连接,保持5秒
return5*1000;
}else{
// 其他路由保持30秒
return30*1000;
}
}
})

 

http://backend.blog.163.com/blog/static/202294126201282210401349/

分享到:
评论

相关推荐

    httpclient4.0-jar

    HttpClient 4.0引入了多路复用(HTTP/1.1的连接池)功能,极大地提高了性能。连接池允许重用已经建立的TCP连接,减少了建立新连接的开销,尤其在处理大量并发请求时效果显著。此外,HttpClient 4.0还支持异步操作,...

    httpclient4.0

    HttpClient 4.0 强化了连接管理,包括连接池的使用和重用,这有助于提高性能并减少服务器压力。`PoolingHttpClientConnectionManager` 可以配置最大连接数、每个路由的最大连接数等,还可以设置超时和自动回收策略。...

    httpclient4.0 使用帮助、例子

    HTTPClient是Apache软件基金会的一个开源Java库,它提供了一个强大的、功能丰富的支持HTTP协议的客户端编程工具包。...在实际使用过程中,还需要注意线程安全、连接池管理等问题,以确保程序的稳定性和性能。

    Httpclient4.0和3.0及jsoup等相关jar包

    1.含有官方HttpClient4.0的jar包 2.有之前HttpClient3.0的jar包,就是import importorg.apache.commons.*; 3.包含jsoup,解析HTML的jar包 4.包含jcookie.jar及jtidy-r938.jar的jar包.

    httpclient4.0源文件

    1. **连接池管理**:通过`PoolingClientConnectionManager`,HttpClient可以复用TCP连接,提高性能。 2. **认证机制**:支持多种认证方式,如Basic、Digest、NTLM和Kerberos,源码中这部分涉及`CredentialsProvider...

    httpclient-4.0.jar

    httpclient-4.0.jar, httpclient-4.0.jar, httpclient-4.0.jar

    HttpClient 4.0学习

    - 多种连接管理策略,如单一连接、多线程连接池 - 支持Cookie管理,处理会话保持 - 支持HTTP基本认证、NTLM认证、Kerberos认证等多种认证机制 - 支持HTTP代理和隧道穿透 - 提供了POST、PUT、DELETE等HTTP方法 ...

    原创: httpclient 4.0 使用 - 访问开心网的各种组件 例子

    HttpClient 4.0 提供了对 HTTP 协议的全面支持,包括 GET、POST、PUT、DELETE 等方法,以及 Cookie 管理、重定向处理、连接池管理等高级功能。它以模块化的设计允许开发者根据需求选择使用不同的组件,提高了代码的...

    基于Java + HTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行的新浪微博爬虫

    【作品名称】:基于Java + HTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行的新浪微博爬虫 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训...

    HttpClient 4.0的post()方法4个关键“头信息”设置

    在探讨HttpClient 4.0的`post()`方法中四个关键“头信息”的设置之前,我们首先需要理解HttpClient是什么以及它在Java开发中的作用。 ### HttpClient简介 HttpClient是Apache的一个开源项目,它为Java应用程序提供...

    HttpClient 4.0中文教程

    ### HttpClient 4.0中文教程知识点总结 #### 一、HttpClient概述 **1.1 执行请求** - **HTTP请求**: HTTP请求包含了方法名称(GET、POST等)、URL以及必要的请求头信息。HttpClient允许开发者创建并发送这些请求...

    Android升级后旧版本的httpclient4.0

    Android升级后旧版本的httpclient4.0 apache-mime4j-0.6 commons-codec-1.4 commons-logging-1.1.1 httpclient-4.0.1 httpcore-4.0.1 httpmime-4.0.1

    httpclient-4.0-beta1.jar

    httpclient-4.0-beta1.jar

    HttpAsyncClient 异步httpClient和同步httpClient连接池的工具类 包含jar

    HttpAsyncClient连接池的使用,项目中频繁发送http请求,同步http阻塞主线程,影响性能,使用 HttpAsyncClient可使性能提高,这里配合连接池使用,效果更好,同时还附带同步httpClient的连接池使用

    commons-httpclient依赖包

    包括了httpclient的所有包,commons-httpclient3.0.jar,httpclient4.0.jar,commons-logging1.1.1.jar,commons-codec-1.3.jar等

    [原创] Java 天气预告 - htmlparser2.0 + httpclient4.0

    【Java天气预告】项目是基于htmlparser2.0和httpclient4.0这两个库实现的,主要用于抓取和解析网络上的天气信息。这个项目对于学习Java网络编程和HTML解析非常有帮助,它揭示了如何利用HTTP协议获取网页数据以及如何...

    用httpclient-4.0-alpha2 打造基于http协议的网站分析器

    1. 创建HttpClient实例:根据项目需求,可以设置连接池、超时时间、重试策略等。 ```java CloseableHttpClient httpClient = HttpClients.createDefault(); ``` 2. 构建请求:创建HttpGet或HttpPost对象,设置URL...

    基于JavaHTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行详细文档+资料齐全.zip

    基于JavaHTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行详细文档+资料齐全.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行...

    httpclient-4.0-beta2.jar

    httpclient-4.0-beta2.jarhttpclient-4.0-beta2.jarhttpclient-4.0-beta2.jarhttpclient-4.0-beta2.jarhttpclient-4.0-beta2.jarhttpclient-4.0-beta2.jarhttpclient-4.0-beta2.jarhttpclient-4.0-beta2.jar

Global site tag (gtag.js) - Google Analytics