`
m635674608
  • 浏览: 5027444 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

Jsoup中getElementsByClass中className有空格处理

 
阅读更多

今天在做网络爬虫的作业是,用jsoup解析html网页时要获得一个class为ep-time-soure cDGray的div的内容。发现doc.getElementsByClass("ep-time-soure cDGray")取值为空。很郁闷,结果查了一圈资料。知道了有空格是表示这个div继承了两个class。

有两种解决方法。1.如果里面有一个class在网页中是唯一的,那么直接doc.getElementsByClass("ep-time-soure")。因为我发现cDGray好像表示的是字体颜色。2.嵌套调用doc.select(".ep-time-soure").select(".cDGray")。我使用的是前面的一个方法,后面的方法是搜索得到的。

分享到:
评论

相关推荐

    jsoup中文帮助文档

    Jsoup 能处理 URL 并将其转换为绝对路径。例如,当解析文档时,相对 URL 会自动转换为绝对 URL。 10. 程序示例:获取所有链接数据修改 以下示例展示如何获取页面上的所有链接并修改它们的 `href` 属性: ```java ...

    jsoup 中文 api 文档

    `jsoup` 是一个强大的 Java 库,用于处理实际世界中的 HTML。它提供了一种简单、直观的方式来解析、提取和修改网页内容。jsoup 的 API 设计得非常友好,使得开发者可以方便地与 HTML 进行交互,无论是从网络上抓取...

    Jsoup中文Api.docx

    下面是 Jsoup 中一些重要的知识点: 1. 解析和遍历 HTML 文档 Jsoup 提供了多种方式来解析 HTML 文档,包括从字符串、URL 和文件中加载文档。Jsoup 的解析器能够尽最大可能从您提供的 HTML 文档中创造一个干净的...

    JsoupAPI(jsoup帮助文档)

    **Jsoup API 深入解析** Jsoup 是一个用于处理和解析HTML的Java库,它提供了强大的功能,使得在Java程序中操作...在实际使用中,查阅Jsoup的API文档(如jsoup-API-1.10.2-javadoc)将有助于更好地理解和利用这些功能。

    jsoupjar+jsoup中文API

    **jsoup.jar与jsoup中文API** `jsoup`是一个非常强大的Java库,它主要用于处理实际世界中的HTML。...jsoup能够很好地处理不规范...配合中文API文档,无论是初学者还是有经验的开发者,都能更好地利用jsoup实现各种功能。

    jsoup中文教程

    加载过程中,可能会遇到无法连接或解析错误等问题,Jsoup提供了异常处理机制来解决这些问题。 #### 从文件加载文档 Jsoup同样可以加载本地文件系统中的HTML文档。使用`Jsoup.parse(File input, String charsetName,...

    Jsoup中文教程

    如上所示,原始的HTML字符串中有两个未闭合的`<p>`标签,Jsoup自动为它们添加了闭合标签。 ##### 2.3 创建文档结构 Jsoup还会确保文档结构的完整性。例如,如果提供的HTML字符串缺少`<html>`、`<head>`或`<body>`...

    jsoup-1.14.3-API文档-中文版.zip

    赠送jar包:jsoup-1.14.3.jar; 赠送原API文档:jsoup-1.14.3-javadoc.jar; 赠送源代码:jsoup-1.14.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.14.3.pom; 包含翻译后的API文档:jsoup-1.14.3-javadoc-API...

    jsoup-1.11.3-API文档-中文版.zip

    赠送jar包:jsoup-1.11.3.jar; 赠送原API文档:jsoup-1.11.3-javadoc.jar; 赠送源代码:jsoup-1.11.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.11.3.pom; 包含翻译后的API文档:jsoup-1.11.3-javadoc-API...

    jsoup爬虫中文api

    如果指定了基地址,则Jsoup会根据该地址解析文档中的相对URL为绝对URL,这对于处理外部链接尤为重要。 ##### 2.2 文档对象模型 解析后的HTML文档被组织成一个文档对象模型(DOM)。DOM由一系列的 `Node` 组成,其中 ...

    jsoup1.10.3包和jsoupApi帮助文档

    总的来说,jsoup1.10.3及其API文档是Web开发人员的得力工具,无论是在爬虫项目还是网页数据处理中,都能发挥巨大作用。学习和掌握jsoup的使用,对于提升Web开发技能和提高工作效率具有显著效果。

    jsoup中文API

    在本文中,我们将深入探讨如何使用 Jsoup 中文 API,尤其是针对初学者的一些关键功能。 1. **解析和遍历一个 HTML 文档** Jsoup 提供了 `Jsoup.parse(String html)` 方法来解析 HTML 字符串,并将其转化为一个 `...

    Jsoup中文API

    在解析过程中,这有助于正确解析资源引用。 6. 数据修改: - 设置属性值:`elem.attr("attributeName", "newValue")` - 设置元素的 HTML 内容:`elem.html("<b>New HTML</b>")` - 设置元素的文本内容:`elem....

    JSOUP的中文文档

    - JSOUP能够处理相对和绝对URL,确保在解析过程中URL的正确性。 8. **示例:获取所有链接**: - 获取HTML文档中的所有链接是一个常见的需求。可以使用`doc.select("a[href]")`选择所有带有`href`属性的`<a>`标签...

    jsoup1.10.3完整jar包+中文文档

    jsoup是Java开发中处理HTML的强大工具,无论你是要进行网页抓取、数据提取还是内容清洗,它都能提供便捷的解决方案。结合1.10.3版本的更新,jsoup继续保持着其在HTML处理领域的领先地位。如果你还没有尝试过这个库,...

    jsoup-1.15.3.jar

    jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jarjsoup-...

    在android中使用jsoup解析页面链接

    在Android开发中,有时我们需要与网页交互,抓取或解析HTML内容,比如获取网页上的特定信息,这通常可以通过...理解如何在Android环境中正确使用Jsoup,并结合异步任务处理网络请求,是提升应用程序功能的重要技能。

    Jsoup 1.5.2 和jsoup 1.6

    Jsoup在Web抓取、数据分析和网页爬虫项目中广泛应用。本文将深入探讨Jsoup 1.5.2和1.6这两个版本的主要特性、变化以及如何在项目中使用它们。 首先,让我们了解Jsoup的基本功能。Jsoup的核心功能包括: 1. **HTML...

    Jsoup库文件;Jsoup解析Java包

    1. `jsoup.jar`:Jsoup的主要库文件,包含了所有的类和方法,导入此文件即可在项目中使用Jsoup。 2. `README.md`或`README.txt`:文件说明,介绍如何使用Jsoup以及可能的注意事项。 3. `LICENSE`:Jsoup的许可协议,...

Global site tag (gtag.js) - Google Analytics