`
ihuashao
  • 浏览: 4721389 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

jsoup 1.5.1 发布,超棒的HTML解析器

阅读更多

该版本增加单个 pass 选择器用于所有复杂查询,另外使用 CSS 选择器从 DOM 中提取元素的性能得到显著的提升,修复了 Scala 支持的bug,提供新的 HTML 操作特性以及bug修复。

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。

jsoup的主要功能如下:

  1. 从一个URL,文件或字符串中解析HTML;
  2. 使用DOM或CSS选择器来查找、取出数据;
  3. 可操作HTML元素、属性、文本;

jsoup是基于MIT协议发布的,可放心使用于商业项目。

示例代码:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

文章转载自:开源中国社区 [http://www.oschina.net]
本文标题:jsoup 1.5.1 发布,超棒的HTML解析器
本文地址:http://www.oschina.net/news/15627/jsoup-1-5-1-html-parser



本文是使用 B3log Solo简约设计の艺术 进行同步发布的
分享到:
评论

相关推荐

    jsoup-1.5.1

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 jsoup 的主要功能如下: 1. 从一个 ...

    jsoup:Java HTML 解析器

    jsoup:Java HTML 解析器 jsoup是一个用于处理现实世界 HTML 的 Java 库。它使用最好的 HTML5 DOM 方法和 CSS 选择器,提供了一个非常方便的 API,用于获取 URL 以及提取和操作数据。 jsoup实现了WHATWG HTML5规范...

    jsoup Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容

    **jsoup:Java的HTML解析库** jsoup是一款强大的Java库,专为处理HTML文档而设计。它允许开发者轻松地解析、提取和修改HTML内容,就像在Web浏览器中使用jQuery那样方便。jsoup的主要功能包括: 1. **HTML解析**:...

    jsoup-1.6.3.rar HTML解析器

    综上所述,jsoup是一个强大的HTML解析库,它简化了Java开发者处理HTML文档的工作,提供了丰富的API和CSS选择器支持。无论是在数据提取、网页解析还是安全防护方面,jsoup都是一个值得信赖的工具。通过使用`jsoup-...

    基于java的开发源码-HTML解析器 jsoup.zip

    基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip ...

    HTML解析器 jsoup

    jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。 jsoup的主要功能如下: 从一个URL,文件或...

    使用Jsoup解析html网页

    Jsoup以浏览器的方式解析HTML,使得我们可以方便地通过CSS选择器来查找和操作元素,极大地简化了这一过程。 ### Jsoup的基本概念 1. **Jsoup连接(Connection)**:使用Jsoup的第一步是建立到目标网页的连接。这...

    jsoup Java HTML解析器

    **jsoup Java HTML解析器详解** jsoup是一个用于处理实际世界HTML的Java库。它提供了非常方便的方法来提取和操作数据,使用DOM,CSS以及类似于jQuery的API。jsoup能够理解HTML的不完美之处,同时提供了强大的功能来...

    Jsoup库文件;Jsoup解析Java包

    Jsoup是一款强大的Java库,专为处理HTML文档而设计,同时也支持XML解析。它提供了简单易用的API,使得开发者可以方便地抓取、解析、修改以及清理HTML内容。Jsoup能够模拟浏览器的行为,理解HTML文档的结构,并通过...

    jsoupAPI解析html

    **jsoup API解析HTML** jsoup是一个非常强大的Java库,专为处理真实世界的HTML而设计。它提供了方便的API,用于提取和操作数据,使用DOM,CSS和jQuery-like方法。在深入jsoup的API之前,我们需要理解HTML解析的重要...

    JAVA源码HTML解析器jsoupJAVA源码HTML解析器jsoup

    JAVA源码HTML解析器jsoupJAVA源码HTML解析器jsoup

    HTML解析器 jsoup资料

    HTML解析器jsoup是Java库,专为处理真实世界的HTML而设计。它提供了一种方便、安全的方式来抓取和操作Web页面数据。jsoup模仿了浏览器的行为,能够解析HTML文档,提取结构化数据,并可以执行DOM操作。在这个资料包中...

    Android使用Jsoup技术解析HTML

    **Android使用Jsoup技术解析HTML** Jsoup是一个Java库,专为处理真实世界的HTML而设计。在Android开发中,我们经常需要从网页抓取数据,比如解析新闻标题、获取图片链接或者提取用户评论等。Jsoup提供了一种简单、...

    Jsoup HTML解析器For Java 在Java程序中使用JQuery操作DOM

    Jsoup HTML解析器For Java 在Java程序中使用JQuery操作DOM 模式识别的新技术 狂顶

    java资源HTML解析器jsoupjava资源HTML解析器jsoup

    java资源HTML解析器 jsoupjava资源HTML解析器 jsoup提取方式是百度网盘分享地址

    使用 jsoup 对 HTML 文档进行解析和操作

    **标题:“使用 jsoup 对 HTML 文档进行解析和操作”** **内容概述:** 这篇博客主要探讨了如何利用 jsoup 这个 Java 库来解析和操作 HTML 文档。jsoup 是一个强大的库,它提供了丰富的 API,可以方便地解析 HTML、...

    jsoup + jdid网页动态解析,类似火狐firebug的html查看

    本文将深入探讨使用jsoup和jdid工具进行网页动态解析的方法,类似于火狐浏览器的firebug功能,帮助开发者更好地理解和操作HTML内容。 首先,我们要了解**jsoup**。jsoup是一款强大的Java库,专门用于处理现实世界中...

    jsoup解析HTML

    **JSoup:强大的HTML解析库** JSoup是一个用于处理实际世界HTML的Java库。它提供了非常方便的API,用于提取和操作数据,使用DOM、CSS以及类似于jQuery的方法。在JavaScript中,我们通常会使用jQuery来操作DOM,但在...

    JSoup解析URL或HTML的内容

    **JSoup:强大的HTML解析库** JSoup是一个用于Java的开源库,专门设计用来解析HTML内容,同时也支持从URL抓取网页数据。它提供了一种简单而强大的API,使得开发者可以方便地处理网页结构,提取及操作数据。JSoup的...

    Jsoup解析html+xml

    Jsoup是由Jonas Bonér创建的开源项目,它基于Java标准库的DOM解析器,但提供了更友好的API。要使用Jsoup,首先需要将其添加到你的项目依赖中。如果你使用的是Maven,可以在pom.xml文件中添加以下依赖: ```xml ...

Global site tag (gtag.js) - Google Analytics