httpclient htmlparser来查询手机号相关信息
http://htmlparser.com.cn/post/20090816119.html
public class GetMobile {
/**
* @author rrong_m 51jsp.cn
* @throws IOException
* @throws HttpException
* @throws IOException
* @throws HttpException
* @throws ParserException
*/
public static String getPostString(String mobile) throws HttpException, IOException//发送数据51jsp.cn
{
HttpClient hc=new HttpClient();
PostMethod pm=new PostMethod("http://www.ip138.com:8080/search.asp");
hc.getParams().setContentCharset("gb2312");
pm.addParameter("mobile",mobile);
pm.addParameter("action","mobile");
hc.executeMethod(pm);
return pm.getResponseBodyAsString();
}
public static void getMobileInfor(String poststring) throws ParserException
{
Parser parser=new Parser(poststring);
NodeList nodelist=null;
NodeFilter filter=new HasAttributeFilter("class","tdc2");
nodelist=parser.extractAllNodesThatMatch(filter);
for(int i=0;i<nodelist.size();i++)
{
System.out.println(nodelist.elementAt(i).toPlainTextString().replace(" ",""));
}
}
public static void main(String[] args) throws HttpException, IOException, ParserException {
getMobileInfor(getPostString("1380001"));//直接填写想要查询的手机号码
}
}
分享到:
相关推荐
在IT领域,网络爬虫是获取大量数据的重要手段,尤其对于数据分析、研究和自动化信息处理。本案例聚焦于使用Java语言结合`httpclient`库进行网络请求,以及`htmlparser`库解析HTML文档,实现一个基础的爬虫程序。下面...
【HttpClient和HtmlParser简介】 HttpClient是一个Java库,用于简化HTTP通信。它是由Apache Jakarta项目开发的,旨在提供更高效、更灵活的HTTP客户端支持。HttpClient提供了丰富的特性,遵循最新的HTTP标准,支持...
在本文中,我们将探讨如何使用 HttpClient 和 HtmlParser 这两个Java库来实现一个简单的网页爬虫。HttpClient 是一个强大的HTTP客户端库,而 HtmlParser 则是一个用于解析HTML文档的高效工具,两者结合可以帮助我们...
总结来说,HttpClient 和 HtmlParser(通常指Jsoup)是网络爬虫开发中的重要工具,它们分别负责网络通信和HTML解析,结合使用能够高效地抓取和处理Web数据。在编写爬虫程序时,合理利用这两个库的功能,可以构建出...
本文主要介绍了如何利用HttpClient与HTMLParser这两种技术来实现网页正文的提取。文章首先阐述了互联网信息飞速增长的背景下,网页数据提取的重要性,以及自动化的网页抓取与分析对于科研、工程和商业活动的意义。...
在IT领域,构建一个基于HttpClient...总的来说,HttpClient和HtmlParser是构建查询系统的重要工具,而Struts框架则为这种系统提供了坚实的基础架构。理解并熟练运用这些技术,对于提升开发效率和系统质量具有重要意义。
这段时间在做一个网络爬虫,但是关于HTTPclient+htmlparser两个开源工具包很多版本都不全,这里是我自己收集的、绝对可用的,比较完整的版本。 导入后,需要用import引用. 希望有用,也是我自己做的备份。
本教程将聚焦于如何使用HTMLPARSER和HTTPCLIENT库来构建一个基础的网络爬虫。这两个工具是Java开发者常用来解析HTML和进行HTTP请求的重要库。 首先,HTMLPARSER是一个开源的Java库,它可以解析HTML文档并提供类似于...
总结起来,这个项目利用了Apache HTTPClient来查询股票信息,结合CSV解析库处理返回的数据,可能通过一个股票代码列表文件批量查询。这涉及到网络编程、HTTP协议、数据解析以及文件操作等多个IT领域的知识点。
在本文中,我们将深入探讨如何使用`HttpClient`和`HtmlParser`两个开源库来实现一个简易的网络爬虫。 **HttpClient简介** `HttpClient`是Apache基金会Jakarta Commons项目下的一个子项目,主要提供了对HTTP协议的...
在网络爬虫项目中,HttpClient和HtmlParser常结合使用,HttpClient负责获取网页内容,HtmlParser则负责解析内容并提取有用信息。为了实现更复杂的爬虫功能,如处理JavaScript渲染的页面、模拟登录、反反爬虫策略等,...
在IT领域,网络爬虫是获取大量数据的重要手段,而`HtmlParser`和`HttpClient`则是构建网络爬虫时常用到的两个关键工具。本文将详细介绍这两个库,并结合学习资料来探讨它们在实际应用中的作用。 `HtmlParser`通常是...
在Java编程环境中,开发一个简单的网络爬虫是通过结合使用HttpClient库进行网络请求以及HtmlParser库解析HTML内容来实现的。HttpClient是一个强大的HTTP客户端库,它允许开发者发送各种HTTP请求并接收响应,而...