`
JT10000
  • 浏览: 1062 次
  • 性别: Icon_minigender_1
  • 来自: 珠海
文章分类
社区版块
存档分类
最新评论

HttpClient与HtmlParse完美融合简单实例

阅读更多
当然第一步当然是去网上下载Jar包啦,相信这个应该都会吧!

收索HttpClient下载
收索HtmlParse下载

简单实例代码:

package com.fldyown.advertisement;

import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.util.EntityUtils;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags.LinkTag;
import org.htmlparser.util.NodeList;

public class Advertisement {
/**
* @Enclosing_Method : main
* @Written by : 强
* @Creation Date : 2011-5-17 下午09:01:41
* @version : v1.00
* @Description :
* @param args
**/
public static void main(String[] args) {

try {
HttpClient httpclient = new DefaultHttpClient();
HttpGet httpget = new HttpGet(
"http://www.baidu.com/s?wd=%B7%E3%C1%F8%B5%FB%D4%CF");
HttpResponse response = httpclient.execute(httpget);
HttpEntity entity = response.getEntity();
if (entity != null) {
Parser parser = new Parser(EntityUtils.toString(entity));
NodeList nodeList = parser.parse(null);
NodeFilter filter = new TagNameFilter("a");
NodeList list = nodeList.extractAllNodesThatMatch(filter, true);
for (int i = 0; i < list.size(); i++) {
LinkTag tag = (LinkTag) list.elementAt(i);
System.out.println(tag.getAttribute("href") + "\n");
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}


这个程序很有用,很多时候我们可能需要过滤网页中的一些我们关心的数据,如图片链接,等等,就可以用到!
分享到:
评论

相关推荐

    httpClient和htmlparse获取网页数据使用jar

    1. 创建HttpClient实例:`CloseableHttpClient httpClient = HttpClients.createDefault();` 2. 构建HttpGet请求:`HttpGet httpGet = new HttpGet("http://example.com");` 3. 发起请求并获取响应:`...

    httpClient实例httpClient调用 http/https实例 忽略SSL验证

    要创建一个简单的HttpClient实例,你需要以下步骤: 1. 引入Apache HttpClient库: 在你的项目中,确保已经添加了Apache HttpClient的依赖。例如,如果你使用的是Maven,可以在pom.xml文件中添加以下依赖: ```...

    httpclient用到的jar文件,例子

    接下来,我们将深入探讨HTTPClient库,它的用法,以及POST和GET方法的基本概念。 HTTPClient是Apache软件基金会的 HttpClient项目提供的一个开源库,它是Java平台上的一个HTTP客户端实现。这个库提供了丰富的功能,...

    httpclient的入门实例

    在实际应用中,HttpClient可以与其他工具或框架结合使用,如Spring框架,以简化HTTP客户端的集成和管理。 总之,HttpClient是Java开发人员执行HTTP请求的强大工具,其丰富的功能和灵活性使其成为处理HTTP通信的首选...

    HttpClient4.5全部jar包+简单实例

    这个压缩包包含了HttpClient 4.5所需的全部jar包,以及一个简单的实例`PTXCheckTools.java`,方便用户快速理解和应用。 HttpClient库的核心功能包括: 1. **HTTP协议支持**:HttpClient支持HTTP/1.1和HTTP/2协议,...

    Httpclient+testng接口测试小例子

    本示例将探讨如何利用Apache HttpClient库与TestNG框架进行接口测试,以提高测试效率和准确性。 Apache HttpClient是一个开源Java库,允许开发者发送HTTP请求并接收响应,支持多种HTTP协议版本,包括HTTP/1.1和...

    HttpClient用法,实例

    HttpClient用法,实例 HttpClient用法,实例 HttpClient用法,实例 HttpClient用法,实例

    httpclient.post例子

    以下是一个简单的POST请求实例: 1. 引入必要的库: ```java import org.apache.http.HttpEntity; import org.apache.http.client.methods.CloseableHttpResponse; import org.apache....

    httpClient 网络传输的实例

    HttpClient是Java中用于HTTP通信的库,由Apache软件基金会开发并维护。...本实例将深入讲解如何使用HttpClient进行网络传输。...在实际项目中,应结合具体需求,灵活运用HttpClient提供的功能,提高代码的可读性和维护性。

    httpClient例子

    下面是如何创建一个简单的GET请求的例子: ```java CloseableHttpClient httpclient = HttpClients.createDefault(); HttpGet httpGet = new HttpGet("http://example.com"); try { HttpResponse response = ...

    httpClient+jsoup抓取网页数据实例和jar包

    本教程将详细介绍如何结合使用HttpClient与Jsoup来抓取和处理网页数据。 HttpClient是Apache基金会开发的一个开放源代码库,它允许开发者发送HTTP请求并接收响应,支持多种HTTP协议版本。HttpClient提供了丰富的...

    C#HTTPclient 实例应用

    创建`HttpClient`实例通常是通过静态`HttpClientFactory`方法或直接实例化`HttpClient`完成的。为了确保高效的资源管理,建议使用`HttpClientFactory`,尤其是对于频繁创建和销毁`HttpClient`的情况,这可以避免过多...

    httpclient4.0 使用帮助、例子

    建议在实际开发中,结合文档深入理解HTTPClient的功能和最佳实践。 总结,HTTPClient 4.0是一个强大且灵活的HTTP客户端库,它提供了丰富的功能,能够满足大多数HTTP通信需求。通过阅读提供的文档和示例,开发者可以...

    HttpClient包及例子

    HttpClient是Apache基金会开发的一个Java库,它为Java开发者提供了一种简单且强大的API来执行HTTP请求,无论是GET、POST还是其他HTTP方法。这个库的主要目标是简化与HTTP服务器的交互,使得开发人员能够轻松地创建...

    httpclient简单示例说明

    在实际开发中,HttpClient通常与其他工具或框架结合使用,例如Spring MVC,用于发送HTTP请求并处理响应。了解和熟练使用HttpClient是每个Java开发者必备的技能之一,它极大地简化了网络编程的工作。 以上就是关于...

    webservice调用实例,通过HttpClient调用

    在这个例子中,我们使用了`NameValuePair`来构造POST请求的参数,然后设置到请求实体中。 在实际应用中,我们可能还需要处理其他HTTP方法(如PUT、DELETE等),以及自定义头部信息、身份验证、超时设置等。...

    简单的httpClient访问

    这篇名为“简单的httpClient访问”的博文可能是介绍如何使用HttpClient进行基础的HTTP请求。HttpClient库提供了丰富的功能,包括GET、POST请求,设置请求头,处理响应,以及支持HTTPS等。接下来,我们将深入探讨...

    httpClient4.3.6包和实例

    1. **HttpClient实例**:HttpClient是线程不安全的,所以通常推荐每个请求创建一个新实例。`HttpClientBuilder`类可以用来构建自定义配置的客户端实例。 2. **请求执行器(RequestExecutor)**:处理HTTP请求和响应...

    httpclient简单使用

    本教程将基于标题"HTTPClient简单使用"和提供的文件`HttpService`、`HttpClient`来阐述HTTPClient的基本使用方法。 1. **HTTPClient简介** HTTPClient是Apache的 HttpClient库,它为Java开发者提供了全面的HTTP...

    htmlparse.jar httpClient.jar je.jar

    标题中的"htmlparse.jar httpClient.jar je.jar"暗示了这些文件是Java编程中使用的库或框架,主要用于处理HTML解析和HTTP客户端通信。以下是对这些库的详细说明: 1. **htmlparse.jar**: 这个文件可能包含一个HTML...

Global site tag (gtag.js) - Google Analytics