`
RonQi
  • 浏览: 93411 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Jsoup-1.6.0的一个bug—解析html标签内容只是0被忽略掉了

    博客分类:
  • Java
阅读更多

有一个需求,想要把带html标签的字符串中的纯文本内容做截取,尝试使用Jsoup ,版本是 jsoup-1.6.0.jar , 使用起来确实方便,但发现一个问题标签中内容如果只有一个0 的话Jsoup居然不认,很奇怪

 

		String html = "<span lang=EN-US>0</span>";
		Document doc = Jsoup.parse(html);
		Elements eles = doc.getElementsByTag("span");
		Element span = eles.get(0);
		System.out.println(span.hasText());//false
		System.out.println(span.ownText());//空串

 

暂时没有好的解决办法。

 

--------------------

哈哈Stackoverflow 真强大,问题刚发就有人回应,一楼的哥们说是jsoup的bug,他用jsoup-1.3.3就正常。我试了一下,还真是但有一个问题是我用了Element.clone()方法,1.3.3的版本还不支持,我继续试了更新的版本,最好又支持clone方法又没有这个bug。结果发现是在1.6的时候新出的bug,所以可以使用1.6之前最新的版本 jsoup-1.5.2.jar ,哈,问题解决了。

 

注:

1. 问题放到了Stackoverflow 上,呵呵,第一次去那儿;

2. 初步感觉Stackoverflow上面问问题比je的问答频道更好些,呵呵。

分享到:
评论

相关推荐

    jsoup-1.6.0-sources

    很好用的一下html页面分析jar包jsoup-1.6.0-sources

    jsoup-1.15.3.jar

    jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jarjsoup-...

    jsoup-1.14.3-API文档-中文版.zip

    赠送jar包:jsoup-1.14.3.jar; 赠送原API文档:jsoup-1.14.3-javadoc.jar; 赠送源代码:jsoup-1.14.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.14.3.pom; 包含翻译后的API文档:jsoup-1.14.3-javadoc-API...

    jsoup-jsoup-1.6.1.zip

    jsoup的设计目标是处理真实世界中的HTML,它能够处理不规则、不完整的HTML代码,尽可能地恢复原始的结构,为开发者呈现一个干净、结构化的DOM树。 在jsoup 1.6.1版本中,我们可以看到这个库已经相当成熟,提供了...

    jsoup-1.6.0

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 jsoup 的主要功能如下: 1. 从一个 ...

    jsoup-1.10.3-API文档-中文版.zip

    赠送jar包:jsoup-1.10.3.jar; 赠送原API文档:jsoup-1.10.3-javadoc.jar; 赠送源代码:jsoup-1.10.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.10.3.pom; 包含翻译后的API文档:jsoup-1.10.3-javadoc-API...

    jsoup-1.11.3.jar

    1. **HTML解析**:Jsoup能够解析HTML字符串或者从URL加载HTML内容,并将其转换为一个可操作的DOM树结构。这样,开发者可以通过CSS选择器来定位和提取HTML元素,类似于Web浏览器的工作方式。 2. **DOM操作**:Jsoup...

    jsoup-1.6.3.rar HTML解析器

    通过解析HTML,jsoup可以生成一个与原始页面结构相同的DOM树,这使得开发者能够像操作DOM一样操作网页内容。 ### CSS选择器支持 jsoup支持CSS选择器,这使得从HTML中选择特定元素变得轻而易举。使用类似jQuery的...

    jsoup-1.11.2.rar

    在“jsoup-1.11.2.rar”压缩包中,包含了jsoup库的1.11.2版本,即“jsoup-1.11.2.jar”文件,这是一个可执行的Java档案,用于在项目中直接引用和使用jsoup。此外,还包含了一个“jsoup-1.11.2.txt”文件,可能包含了...

    爬虫所需jsoup-1.8.3.jar

    jsoup的设计理念是结合了DOM、CSS以及类似jQuery的API,使得开发者能够轻松地处理网页内容,尤其对于爬虫开发而言,jsoup是一个不可多得的工具。 1. **解析HTML** jsoup的核心功能是对HTML进行解析,将网页内容...

    jsoup-1.11.2.jar工具类包.rar

    jsoup-1.11.2.jar JsoupXpath-0.3.2.jar jsoup-1.11.2-sources.jar jsoup-1.11.2-javadoc.jar 解析读取xml或html文档的工具类

    jsoup-jsoup-1.12.2.zip

    4. **安全链接提取**:jsoup包含了一个链接安全过滤器,可以确保提取的链接符合预期,避免恶意网站的注入。 5. **HTML清理**:除了解析HTML,jsoup还能够清理不规范的HTML,使其符合HTML5标准,同时保留原有的结构...

    jsoup-1.11.3-API文档-中文版.zip

    赠送jar包:jsoup-1.11.3.jar; 赠送原API文档:jsoup-1.11.3-javadoc.jar; 赠送源代码:jsoup-1.11.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.11.3.pom; 包含翻译后的API文档:jsoup-1.11.3-javadoc-API...

    jsoup-1.9.2.rar

    这个`jsoup-1.9.2.rar`压缩包包含了jsoup库的1.9.2版本以及一个使用教程,帮助开发者快速上手。 **jsoup核心功能** 1. **HTML解析**:jsoup可以解析HTML文档,将其转化为一个可操作的Document对象,就像DOM树一样...

    html解析利器 jsoup-1.7.1-sources.jar

    java开源工具 html解析利器 jsoup-1.7.1-sources.jar

    jsoup-1.14.3-API文档-中英对照版.zip

    赠送jar包:jsoup-1.14.3.jar; 赠送原API文档:jsoup-1.14.3-javadoc.jar; 赠送源代码:jsoup-1.14.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.14.3.pom; 包含翻译后的API文档:jsoup-1.14.3-javadoc-API...

    Jsoup-1.8.3.jar

    2. **DOM遍历**:解析后的HTML可以被看作是一个DOM树,用户可以通过CSS选择器来定位元素,就像在jQuery中一样。这使得查找和操作特定的HTML元素变得简单。 3. **数据提取**:Jsoup提供了一系列方法来提取文本、属性...

    jsoup-1.11.3-API文档-中英对照版.zip

    赠送jar包:jsoup-1.11.3.jar; 赠送原API文档:jsoup-1.11.3-javadoc.jar; 赠送源代码:jsoup-1.11.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.11.3.pom; 包含翻译后的API文档:jsoup-1.11.3-javadoc-API...

    jsoup-1.8.1.jar

    **jsoup-1.8.1.jar** 是一个在Android开发中广泛使用的工具包,主要用于网页数据抓取和解析。这个库源自Java,因此它的名字是JavaScript Object Notation for SQL (jsoup)的一个变体,但实际上它与JSON并无直接关联...

Global site tag (gtag.js) - Google Analytics