`

通过httpClient4读取页面内容

阅读更多
HttpClient httpClient = new DefaultHttpClient();
		HttpClientParams.setCookiePolicy(httpClient.getParams(), CookiePolicy.BROWSER_COMPATIBILITY);  
		HttpHost httpHost = new HttpHost("localhost");
		HttpGet httpGet = new HttpGet("/https/");
		
		HttpResponse response = httpClient.execute(httpHost,httpGet);
		
		if(HttpStatus.SC_OK==response.getStatusLine().getStatusCode()){
			//请求成功
			//取得请求内容
			HttpEntity entity = response.getEntity();
			//显示内容
			if (entity != null) {
				// 显示结果
			System.out.println(EntityUtils.toString(entity,"utf-8"));
			}
		}
		httpGet.abort();

分享到:
评论

相关推荐

    HttpClient以及获取页面内容应用

    通过一个URLConnection或者一个保存有网页内容的字符串来初始化Parser,或者使用静态函数来生成一个Parser对象。 ParserFeedback的代码很简单,是针对调试和跟踪分析过程的,一般不需要改变。而使用Lexer???? ...

    commons-httpclient-3.0-rc4.rar

    4. **处理响应**:获取HttpResponse,读取状态码、头部信息和实体内容。 5. **释放资源**:使用完成后,记得释放HttpClient和HttpMethod资源。 四、高级特性 1. **多线程支持**:HttpClient支持并发请求,可以通过...

    httpClient

    // 读取为 InputStream,在网页内容数据量大时候推荐使用 // InputStream response = getMethod.getResponseBodyAsStream(); } catch (HttpException e) { // 发生致命的异常,可能是协议不对或者返回的内容有...

    httpClient需要的jar包

    EntityUtils类提供了读取和解析响应实体内容的方法。 5. **重试和恢复策略**:HttpClient可以通过设置RetryHandler来决定在网络异常或HTTP错误状态时是否重试请求。 6. **认证和安全**:HttpClient支持多种认证...

    彻底解决httpClient乱码问题

    通常,这样的工具类会包含一个方法,如`createHtmlPage`,它会处理所有与解码相关的细节,确保正确读取和处理响应内容。 5. **静态化处理**:在处理HTML页面时,静态化是一种常见的技术,它将动态内容转化为静态...

    HttpClient介绍和使用文档

    以下是一个使用HttpClient简单读取网页内容的例子: ```java import java.io.IOException; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.methods.GetMethod; public ...

    httpclient4

    通过理解和掌握这些知识点,开发者能够灵活地使用HttpClient4进行网络通信,实现各种复杂的网络任务,包括模拟登录在内的各种应用场景。在实际项目中,应结合具体需求,合理使用HttpClient4提供的功能,以达到高效、...

    HttpClient入门陆小马功钟浩.pdf

    根据提供的文件内容,我们可以梳理出关于HttpClient入门的相关知识点。 首先,HttpClient是一个开源工具,属于Apache组织,用于处理HTTP请求和响应。它不是一个浏览器,不涉及浏览器的客户端缓存等附加功能,它仅是...

    httpclient-4.5.6.rar

    4. **处理响应**:从响应对象中读取状态码、头信息和实体内容,进行相应的业务处理。 四、HttpClient 的最佳实践 1. **正确关闭资源**:使用完 HttpClient 后,记得调用 `close` 方法关闭连接,避免资源泄露。 2....

    用HttpClient来模拟浏览器GET_POST

    下面是一个简单的例子,演示如何使用HttpClient来读取一个网页的内容: ```java package http.demo; import java.io.IOException; import org.apache.commons.httpclient.*; import org.apache.commons.httpclient...

    HttpClient4.3教程 PDF格式

    它是现代Web技术的基础,支持从简单的网页浏览到复杂的电子商务交易等各种应用。随着技术的发展,越来越多的设备和应用开始使用HTTP协议进行通信。然而,Java标准库中的***包虽然提供了基础的HTTP功能,但对于许多...

    httpclient 获取技术博客列表

    4. 从HttpResponse中获取HttpEntity,然后读取实体内容,通常是HTML或JSON格式。 5. 解析内容,提取所需信息,如博客列表的链接。 6. 关闭资源,释放连接。 学习HttpClient的知识点还包括理解HTTP协议的基本概念,...

    爬虫:httpclient+jsoup

    本文将详细探讨使用Java中的两种库——HttpClient和Jsoup,以及它们结合使用来构建网页爬虫的方法。 HttpClient是Apache软件基金会的一个项目,提供了对HTTP协议的全面支持,包括请求/响应模型、连接管理、重定向...

    android AppWidgetProvider httpclient 扒取网页

    执行请求后,你可以通过HttpResponse获取HttpEntity,从中读取响应内容,通常是HTML源代码。 获取到网页数据后,你需要解析这个HTML以提取新闻标题和内容。这通常涉及DOM解析(Document Object Model)或者使用像...

    Android源码之用HttpClient获取网页

    6. 处理响应:从HttpResponse中获取HttpEntity对象,然后读取网页内容。注意,通常我们需要处理可能出现的IOException。 ```java HttpEntity entity = httpResponse.getEntity(); if (entity != null) { String ...

    httpclient使用教程

    通过上述步骤,我们可以利用HttpClient轻松实现HTTP GET请求,获取网页内容或API数据。此教程不仅介绍了HttpClient的基本使用方法,还强调了资源管理和异常处理的重要性,是Java开发者处理HTTP通信不可或缺的技能之...

    HttpClient 登录163邮箱

    HttpClient通过`CookieStore`和`CookiePolicy`管理cookies。当收到包含Set-Cookie头的响应时,HttpClient会自动保存cookie,并在后续请求中发送它们。 7. **源码分析** 博文链接提供的源码可能展示了如何利用...

    Android例子源码使用HttpClient获取网页html源代码

    读取HTML内容的方式与`HttpClient`类似,但最后需关闭输入流并断开连接。 总结来说,虽然HttpClient在早期Android版本中更常见,但随着版本的更新,HttpURLConnection成为了首选。两者都可以用来获取网页HTML源代码...

    httpclient手册

    Apache HttpClient 4.4教程是本手册的核心内容,它涵盖了HttpClient的安装、配置、基本用法以及高级特性。以下是一些重要的知识点: 1. **安装与引入**:在Java项目中,可以通过Maven或Gradle来添加HttpClient的...

    java httpclient 模拟登录

    在"java httpclient 模拟登录"这个场景下,我们通常会用到HttpClient来模拟用户登录网站的过程,获取登录后的session信息,以便后续能够访问登录后才能看到的页面内容。以下将详细介绍如何使用Java HttpClient进行...

Global site tag (gtag.js) - Google Analytics