`

xpath学习

阅读更多
学习HtmlUnit的时候,看到了Xpath,主要是用Xpath选择hml或者xml中的元素,

先给一段代码:

WebClient client = new WebClient(BrowserVersion.INTERNET_EXPLORER_8);
HtmlPage page = client
.getPage("http://218.75.208.250:8089/opac/jdjsjg.jsp");

这是获取到了HtmlPage。

List<DomeNode> nodeList = page.getByXPath("/table[@class='.xxtable']");


这里可以选择用Jsoup,即Document d = Jsoup.parse(p.asXml());
接下来用d.select.... 去获取相关的元素。


今天我主要说Xpath, 在W3cschool中学习的,

nodename 根据name查找所有的节点
/         表示从根目录下搜索
//         在当前的目录下搜素,不管在什么位置
.         获取当前的节点
..         获取父节点
@         根据属性去获取节点


下面给几个事例:

/bookstore/book[1]
/bookstore/book[last()]
/bookstore/book[last()-1]
/bookstore/book[position()<3]
//title[@lang]
//title[@lang='eng']
/bookstore/book[price>35.00]
/bookstore/book[price>35.00]/title





* Matches any element node
@* Matches any attribute node
node() Matches any node of any kind

/bookstore/* Selects all the child nodes of the bookstore element
//* Selects all elements in the document
//title[@*] Selects all title elements which have any attribute



//book/title | //book/price Selects all the title AND price elements of all book elements
//title | //price Selects all the title AND price elements in the document
/bookstore/book/title | //price


分享到:
评论

相关推荐

    XPath学习手册

    详尽描述XPath的各种使用方法。让xml操作更简单。

    Xpath学习代码.py

    python爬虫xpath学习代码源代码

    xPath学习教程(全)

    XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。 资料整理来源:...

    xpath学习笔记 比较入门大家共享

    XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它被广泛应用于XML处理,如XSLT、XQuery以及XPointer等标准中。XPath通过路径表达式来选取XML文档中的元素、属性或其他类型的节点,使得我们可以...

    XML操作及XPath学习

    XML(eXtensible Markup Language)是一种用于标记数据的语言,它设计的目标是传输和存储数据,而不是显示数据。XML的设计原则是易于阅读和编写,同时也...学习这些内容将有助于理解和操作XML文档,提高数据处理能力。

    Python爬虫课程作业,requests+xpath学习

    内容概要:学习使用爬虫技术从网络爬取小说 技术:Python,requests,xpath,lxml 能学到什么:Python爬虫基础,requests基础,xpath数据提取。 适用人群:软件开发与爬虫学习人群,具有一定的编程技术 使用场景:...

    XPATH学习,xpath入门的好东西啊

    ### XPATH基础与实战应用详解 #### 一、XPATH简介 XPATH是一种用于XML文档查询的语言,它能够帮助我们快速地在XML文档中查找信息。XPATH支持使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式非常...

    xpath文件

    综上所述,这个压缩包提供了从基础到实践的XPath学习资源,包括了理论教程、实战指导和辅助工具。无论是初学者还是经验丰富的开发者,都能从中受益。通过阅读CHM和PDF文件,我们可以系统学习XPath的语法和用法;而...

    xpath语法与函数

    #### XPath学习建议 在学习XPath之前,建议先熟悉HTML/XHTML和XML/XML命名空间的基础知识。这有助于更好地理解XPath如何在XML文档中导航。此外,可以参考W3School提供的完整XPath 2.0、XQuery 1.0和XSLT 2.0的内置...

    用XPath 表达式从 XML 文档中提取信息

    在"xpath学习.doc"文档中,可能详细介绍了XPath的语法、使用方法、示例以及常见问题解决策略。通过阅读这份文档,你可以深入理解XPath的工作原理,并掌握如何利用XPath有效地从XML文档中提取信息,从而提升在处理XML...

    学习xpath必看

    初学者可以下载学习,对xpath的学习很有帮助。初学者可以下载学习,对xpath的学习很有帮助。

    【学习 XPath】.pdf

    XPath 教程是一个系统的学习资源,它包括 XPath 简介、XPath 节点、XPath 语法、XPath 轴、XPath 运算符、XPath 函数、XPath 实例等内容。通过学习 XPath 教程,您将掌握 XPath 的基础知识和应用技能。 因此,XPath...

    w3cschool菜鸟教程离线版chm手册 2016

    w3cschool菜鸟教程离线版目录: ...学习 HTML ...学习 XPath 学习 XQuery 学习 XLink 学习 XPointer 学习 Schema 学习 XSL-FO 学习 SVG Web Services 学习 Web Services 学习 WSDL 学习 SOAP 学习 RSS 学习 RDF

    IE下获取XPATH小工具源码_xpath_

    通过深入研究和理解这个C#小工具的源码,不仅可以提升对XPath的掌握,还能学习到C#中DOM操作和事件处理的相关知识,这对于Web开发或者XML处理的程序员来说是非常宝贵的技能。同时,这也是一次实践面向对象编程、用户...

    谷歌浏览器XPath2.0插件

    XPath Helper是一款专为谷歌浏览器设计的...它不仅适合新手学习XPath,也适用于经验丰富的开发者快速调试和优化XPath表达式,大大提升了开发效率。总之,XPath Helper是每个依赖XPath进行网页处理的工作者的理想伴侣。

    WebDriver-xpath和WebDriver-Css学习

    2. **选择器的使用**:学习如何编写XPath和Css表达式来定位页面上的特定元素,例如,通过id、class、tag name、属性等进行定位。 3. **定位策略**:掌握XPath和Css的不同定位策略,如绝对路径与相对路径,类选择器、...

    xpath-helper.zip

    XPath Helper 是一个强大的工具,主要用于协助开发者在XML或HTML文档中高效地定位和提取数据,尤其在Web爬虫开发中发挥...在学习和使用Python进行Web爬虫开发时,理解并熟练掌握XPath及其相关的库如lxml是至关重要的。

    XPath教程

    XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点...通过本教程的学习,你应该能够运用XPath有效地在XML文档中导航、选取信息,并在XSL和其他XML相关技术中灵活应用。

Global site tag (gtag.js) - Google Analytics