0 0

关于HttpClient和Jsoup0

直接用jsoup也可以得到网页的代码呀 为什么还要通过httpClient呢 菜鸟问下

问题补充:Jsoup 的 这个语句也可以抓取网页啊
Document content = Jsoup.connect("http://www.baidu.com").get();
2012年5月31日 11:48

3个答案 按时间排序 按投票排序

0 0

采纳的答案

应该是httpClient抓取更牛逼吧,属于专业的抓取网页的库,可以设置代理,抓取失败可以重试抓取之类的
在抓取上jsoup比较弱,API简单,所以功能也简单么,主要是扩展htmlparser的功能吧,解析html。。

2012年5月31日 23:24
0 0

httpClient的http://wenku.baidu.com/view/0b6fb791daef5ef7ba0d3c9a.html参考
jsonp的wenku.baidu.com/view/e97c8eb465ce05087632130d.html参考

2012年6月01日 09:57
0 0

Jsoup是对网页进行解析的吧 相当于htmlparser,HTTPCLIETNT是从网上抓取网页用的,用来向服务器发送请求的,然后得到返回的网页,然后jsoup再对返回的网页进行解析

2012年5月31日 13:46

相关推荐

    基于SSM+maven+httpClient+jsoup实现小说网站项目.zip

    基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+maven+httpClient+jsoup实现小说网站项目 基于SSM+...

    基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip

    基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip 基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip 基于SSM+maven+httpClient+jsoup实现小说网站项目源码.zip 基于SSM+maven+httpClient+jsoup实现...

    httpClient+jsoup 抓取网页数据

    实际操作时,可能还需要考虑登录、分页、动态加载等问题,这些可以通过HttpClient设置cookie和处理重定向,或者使用Jsoup的Jsoup.connect模拟JavaScript执行来解决。 总之,HttpClient和Jsoup是Java开发者进行网页...

    HttpClient和jsoup架包

    HttpClient和Jsoup是Java开发中常用的两个库,用于处理HTTP请求和解析HTML文档。HttpClient是一个由Apache基金会开发的开源库,提供了丰富的API用于发送HTTP请求并处理响应,而Jsoup则是一个强大的HTML解析器,可以...

    httpClient采集jsoup解析

    HttpClient和Jsoup是Java开发中常用的两个库,用于网络数据采集和HTML解析。HttpClient提供了强大的HTTP客户端服务,而Jsoup则是一个优秀的库,用于处理和理解HTML文档结构。本篇文章将深入探讨这两个库的使用方法...

    httpClient和jsoup整合,支持 HTTP 协议的客户端编程工具包

    在Java开发中,HttpClient和Jsoup是两个非常重要的库,分别用于处理HTTP协议的客户端请求和解析HTML内容。本文将详细介绍如何将HttpClient与Jsoup整合,以便在进行网络请求时获取并解析网页数据。 HttpClient是...

    爬虫:httpclient+jsoup

    本文将详细探讨使用Java中的两种库——HttpClient和Jsoup,以及它们结合使用来构建网页爬虫的方法。 HttpClient是Apache软件基金会的一个项目,提供了对HTTP协议的全面支持,包括请求/响应模型、连接管理、重定向...

    httpClient+jsoup抓取网页数据实例和jar包

    在IT领域,网络爬虫是获取网页数据的重要手段,而HttpClient和Jsoup是两种常用的Java库,用于实现这一目的。HttpClient提供了低级别的HTTP通信能力,而Jsoup则是一个解析和操作HTML文档的强大工具。本教程将详细介绍...

    最新httpClient+Jsoup jar包及其依赖包

    包含httpclient-4.5.3.jar,以及其依赖包commons-codec-1.9.jar,commons-logging-1.2.jar,httpcore-4.4.6.jar。包含jsoup-1.10.2.jar

    使用HttpClient 和 jsoup 下载 Google logo

    Google的logo,感觉设计的很好,最近看了java的jsoup(html 解析器)把Google的logo全部下载下来,另外,在Google logos页面发现都是英文的,通过利用Google翻译api对logo说明进行翻译,最终把图片信息以及翻译结果...

    HttpClient ,jsoup和 HtmlParser ,htmllexer实现简易爬虫用到的jar包

    本话题主要涉及三个关键库:HttpClient、jsoup以及HtmlParser和htmllexer。这些库为构建简单的Java爬虫提供了必要的工具和功能。 HttpClient是Apache基金会的一个开源项目,提供了用于执行HTTP请求的强大工具集。它...

    HttpClient + Jsoup 模拟登陆,解析HTML,信息筛选(广工图书馆)

    本主题将深入讲解如何使用Apache HttpClient库和Jsoup库实现这个目标,以广工图书馆网站为例。这两个库都是Java开发者常用来处理HTTP请求和解析HTML文档的强大工具。 首先,让我们了解**HttpClient**。HttpClient是...

    HttpClient Jsoup爬取天气预报

    HttpClient是Apache基金会开发的一款强大的HTTP...总的来说,HttpClient和Jsoup的结合使用,为Java开发者提供了一个强大且灵活的工具,可以方便地获取和解析网页数据,对于进行数据抓取和分析的项目来说非常实用。

    学习网络爬虫必备,HttpClient+JSOUP

    包含jsoup-1.7.3.jar,jsoup-1.7.3-javadoc.jar,jsoup-1.7.3-sources.jar,com.springsource.org.apache.commons.httpclient-3.1.0.jar,org.apache.commons.httpclient.jar

    Jsoup+httpclient模拟登陆和抓取页面.pdf

    Jsoup+httpclient模拟登陆和抓取页面.pdf

    基于SSM+maven+httpClient+jsoup实现的java爬虫项目,一个完整的小说网站.zip

    该项目是一个使用Java编程语言开发的爬虫程序,它结合了Spring、SpringMVC(SSM)框架、Maven构建工具以及httpClient和jsoup库来抓取和解析网页内容,特别是针对小说网站的数据获取。以下是对这个项目各部分的详细...

Global site tag (gtag.js) - Google Analytics