`
zmx955
  • 浏览: 19017 次
社区版块
存档分类
最新评论

jsoup很好很强大 对html解析{待续正在学}

阅读更多
http://www.open-open.com/jsoup/


Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Document doc = Jsoup.connect("http://example.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post();

这个方法只支持Web URLs (http和https 协议); 假如你需要从一个文件加载,可以使用 parse(File in, String charsetName) 代替。




取得div class “trumb”的titile 和 子div中的id
如果不需要的 可以直接removeAttr(“xxx”);
引用
Document ddd = Jsoup.connect("http://www.funshion.com/movie/ta-2").get();
Elements ys =ddd.select("div.oto_wrap");
System.out.println(ys.get(0).text());


Elements tr = ddd.select("div.trumb");
//得到div下class ”trumb“
for (Element element : tr) {
//http://www.open-open.com/jsoup/selector-syntax.htm
System.out.println(element.children().attr("id"));
System.out.println(element.text());
//System.out.println("1"+element.attributes());
element.removeAttr("title");
element.removeAttr("class");
element.removeAttr("target");

System.out.println(element.children().attr("id"));

}
分享到:
评论

相关推荐

    jsoupAPI解析html

    总结来说,jsoup是一个强大且易用的Java库,它的API设计简洁,支持HTML解析、选择、操作等功能,是处理HTML数据的理想工具。无论是网页抓取、数据提取还是内容修改,jsoup都能提供高效且安全的解决方案。

    使用Jsoup解析html网页

    Jsoup虽然不是完整的DOM解析器,但其简单易用的API和高效的性能使其在许多情况下成为更好的选择。相比于标准的DOM解析器,Jsoup更注重实际的网页解析需求,它的错误容忍度更高,能够处理一些不规范的HTML代码。 ...

    Android使用Jsoup技术解析HTML

    **Android使用Jsoup技术解析HTML** ...总之,Jsoup为Android开发者提供了一个强大的工具,帮助我们高效、安全地解析和处理HTML内容。结合异步处理和UI更新的最佳实践,我们可以构建出优秀的数据驱动的Android应用。

    Jsoup解析html+xml

    Jsoup是一款非常强大的Java库,专门用于处理HTML和XML文档,提供了一系列简洁的API来抓取、解析、修改以及格式化这些文档。在现代Web开发中,数据抓取和网页解析是常见需求,Jsoup凭借其高效且易用的特性,成为...

    jsoup解析HTML

    **JSoup:强大的HTML解析库** JSoup是一个用于处理实际世界HTML的Java库。它提供了非常方便的API,用于提取和操作数据,使用DOM、CSS以及类似于jQuery的方法。在JavaScript中,我们通常会使用jQuery来操作DOM,但在...

    用Jsoup解析html的所有jar包

    Jsoup是一款非常强大的Java库,专门用于处理HTML文档,提供了丰富的API来抓取、解析、修改和输出HTML内容。在Java开发中,如果你需要从网页上提取数据或者进行Web抓取,Jsoup是一个理想的选择。这个压缩包文件“用...

    Jsoup解析html的示例

    Jsoup是一款Java库,它为了解析、提取以及操作HTML提供了强大的功能。在Android开发中,Jsoup尤其有用,因为它能够帮助开发者从网页中提取结构化数据,这对于网络爬虫或者任何需要从网页获取信息的应用来说是至关...

    Jsoup操作解析Html文件

    Jsoup是一款非常强大的Java库,专门用于处理和解析HTML文档。它提供了丰富的API,使得开发者可以轻松地在代码中操作HTML,实现对网页内容的抓取、解析和修改。Jsoup不仅能够帮助我们提取结构化数据,还能够模拟...

    jsoup-1.6.3.rar HTML解析器

    **jsoup:强大的HTML解析库** jsoup是Java开发者的一款利器,它是一个高效且功能丰富的HTML解析库。这个工具能够帮助开发者轻松地处理网页内容,提取有用的数据,并进行相应的操作。jsoup的核心特性在于它的易用性...

    jsoup解析html所需包1.7.3

    JSoup是一款强大的Java库,专为处理和解析HTML文档而设计。它提供了简单易用的API,使开发者能够轻松地提取数据、操作DOM(文档对象模型)以及清理HTML。标题中的"jsoup解析html所需包1.7.3"表明我们将讨论的是JSoup...

    使用Jsoup对Html文件解析

    Jsoup是一个Java库,它提供了强大的功能来解析HTML,提取和操作数据。这个库的设计理念是使处理HTML变得简单,类似于jQuery的API,使得开发者能够方便地访问和操作HTML元素。在本文中,我们将深入探讨如何使用Jsoup...

    jsoup Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容

    **jsoup:Java的HTML解析库** jsoup是一款强大的Java库,专为处理HTML文档而设计。它允许开发者轻松地解析、提取和修改HTML内容,就像在Web浏览器中使用jQuery那样方便。jsoup的主要功能包括: 1. **HTML解析**:...

    httpClient采集jsoup解析

    HttpClient负责从目标网站获取HTML源码,然后Jsoup对这些源码进行解析,提取所需的数据。例如,如果你想要抓取一个新闻网站的最新文章标题,可以先使用HttpClient发送请求获取网页源码,再用Jsoup解析HTML,找到包含...

    jsoup解析html修改文件名

    Jsoup库提供了一个强大的API,可以方便地解析HTML文档,提取元素,以及修改DOM树。它支持CSS选择器,使得定位HTML元素变得极其简单。要使用Jsoup,首先需要将其添加到项目的依赖中。如果你使用的是Maven,可以在pom....

    jsoup解析html

    利用jsoup工具解析html的demo

    Jsoup解析html

    Jsoup是一款非常强大的Java库,专门用于解析HTML文档。它提供了简单易用的API,使得开发者可以方便地抓取和操作HTML数据,而无需复杂的正则表达式或DOM解析器的繁琐工作。在这个主题中,我们将深入探讨Jsoup的主要...

    JSoup解析URL或HTML的内容

    **JSoup:强大的HTML解析库** JSoup是一个用于Java的开源库,专门设计用来解析HTML内容,同时也支持从URL抓取网页数据。它提供了一种简单而强大的API,使得开发者可以方便地处理网页结构,提取及操作数据。JSoup的...

    java html解析 工具jsoup和一个简单例子

    Java HTML解析工具Jsoup是一个强大的库,专门设计用于处理HTML文档,提取和操作数据。它提供了类似于DOM、CSS以及jQuery的API,使得在Java中处理HTML变得简单易行。Jsoup能够连接到网页,下载HTML内容,然后进行解析...

    android使用jsoup 解析html文件

    总结,`jsoup`为Android开发者提供了一个强大且易于使用的工具,可以方便地解析和操作HTML内容。通过合理运用其API,我们可以高效地处理HTML文件,进行内容替换等任务,极大地提高了开发效率。在实际项目中,结合...

    Jsoup解析html中文文档

    jsoup是一款功能强大的Java HTML解析库,不仅可以帮助开发者轻松解析HTML文档,还提供了丰富的API接口用于数据抽取和修改。对于需要处理HTML文档的Java应用程序来说,jsoup无疑是一个值得信赖的选择。

Global site tag (gtag.js) - Google Analytics