`
- 浏览:
32683 次
-
学习HtmlUnit的时候,看到了Xpath,主要是用Xpath选择hml或者xml中的元素,
先给一段代码:
WebClient client = new WebClient(BrowserVersion.INTERNET_EXPLORER_8);
HtmlPage page = client
.getPage("http://218.75.208.250:8089/opac/jdjsjg.jsp");
这是获取到了HtmlPage。
List<DomeNode> nodeList = page.getByXPath("/table[@class='.xxtable']");
这里可以选择用Jsoup,即Document d = Jsoup.parse(p.asXml());
接下来用d.select.... 去获取相关的元素。
今天我主要说Xpath, 在W3cschool中学习的,
nodename 根据name查找所有的节点
/ 表示从根目录下搜索
// 在当前的目录下搜素,不管在什么位置
. 获取当前的节点
.. 获取父节点
@ 根据属性去获取节点
下面给几个事例:
/bookstore/book[1]
/bookstore/book[last()]
/bookstore/book[last()-1]
/bookstore/book[position()<3]
//title[@lang]
//title[@lang='eng']
/bookstore/book[price>35.00]
/bookstore/book[price>35.00]/title
* Matches any element node
@* Matches any attribute node
node() Matches any node of any kind
/bookstore/* Selects all the child nodes of the bookstore element
//* Selects all elements in the document
//title[@*] Selects all title elements which have any attribute
//book/title | //book/price Selects all the title AND price elements of all book elements
//title | //price Selects all the title AND price elements in the document
/bookstore/book/title | //price
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
详尽描述XPath的各种使用方法。让xml操作更简单。
python爬虫xpath学习代码源代码
XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。 资料整理来源:...
XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它被广泛应用于XML处理,如XSLT、XQuery以及XPointer等标准中。XPath通过路径表达式来选取XML文档中的元素、属性或其他类型的节点,使得我们可以...
XML(eXtensible Markup Language)是一种用于标记数据的语言,它设计的目标是传输和存储数据,而不是显示数据。XML的设计原则是易于阅读和编写,同时也...学习这些内容将有助于理解和操作XML文档,提高数据处理能力。
内容概要:学习使用爬虫技术从网络爬取小说 技术:Python,requests,xpath,lxml 能学到什么:Python爬虫基础,requests基础,xpath数据提取。 适用人群:软件开发与爬虫学习人群,具有一定的编程技术 使用场景:...
### XPATH基础与实战应用详解 #### 一、XPATH简介 XPATH是一种用于XML文档查询的语言,它能够帮助我们快速地在XML文档中查找信息。XPATH支持使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式非常...
综上所述,这个压缩包提供了从基础到实践的XPath学习资源,包括了理论教程、实战指导和辅助工具。无论是初学者还是经验丰富的开发者,都能从中受益。通过阅读CHM和PDF文件,我们可以系统学习XPath的语法和用法;而...
#### XPath学习建议 在学习XPath之前,建议先熟悉HTML/XHTML和XML/XML命名空间的基础知识。这有助于更好地理解XPath如何在XML文档中导航。此外,可以参考W3School提供的完整XPath 2.0、XQuery 1.0和XSLT 2.0的内置...
在"xpath学习.doc"文档中,可能详细介绍了XPath的语法、使用方法、示例以及常见问题解决策略。通过阅读这份文档,你可以深入理解XPath的工作原理,并掌握如何利用XPath有效地从XML文档中提取信息,从而提升在处理XML...
初学者可以下载学习,对xpath的学习很有帮助。初学者可以下载学习,对xpath的学习很有帮助。
XPath 教程是一个系统的学习资源,它包括 XPath 简介、XPath 节点、XPath 语法、XPath 轴、XPath 运算符、XPath 函数、XPath 实例等内容。通过学习 XPath 教程,您将掌握 XPath 的基础知识和应用技能。 因此,XPath...
w3cschool菜鸟教程离线版目录: ...学习 HTML ...学习 XPath 学习 XQuery 学习 XLink 学习 XPointer 学习 Schema 学习 XSL-FO 学习 SVG Web Services 学习 Web Services 学习 WSDL 学习 SOAP 学习 RSS 学习 RDF
通过深入研究和理解这个C#小工具的源码,不仅可以提升对XPath的掌握,还能学习到C#中DOM操作和事件处理的相关知识,这对于Web开发或者XML处理的程序员来说是非常宝贵的技能。同时,这也是一次实践面向对象编程、用户...
XPath Helper是一款专为谷歌浏览器设计的...它不仅适合新手学习XPath,也适用于经验丰富的开发者快速调试和优化XPath表达式,大大提升了开发效率。总之,XPath Helper是每个依赖XPath进行网页处理的工作者的理想伴侣。
2. **选择器的使用**:学习如何编写XPath和Css表达式来定位页面上的特定元素,例如,通过id、class、tag name、属性等进行定位。 3. **定位策略**:掌握XPath和Css的不同定位策略,如绝对路径与相对路径,类选择器、...
XPath Helper 是一个强大的工具,主要用于协助开发者在XML或HTML文档中高效地定位和提取数据,尤其在Web爬虫开发中发挥...在学习和使用Python进行Web爬虫开发时,理解并熟练掌握XPath及其相关的库如lxml是至关重要的。
XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点...通过本教程的学习,你应该能够运用XPath有效地在XML文档中导航、选取信息,并在XSL和其他XML相关技术中灵活应用。