基本的XPath语法类似于在一个文件系统中定位文件
1 如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径。
2 如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)
3 星号 * 表示选择所有由星号之前的路径所定位的元素
4 方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函数则表示选择集中的最后一个元素
5 属性通过前缀 @ 来指定
6 属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格
7 count()函数可以计数所选元素的个数
8 name()函数返回元素的名称, start-with()函数在该函数的第一个参数字符串是以第二个参数字符开始的情况返回true, contains()函数当其第一个字符串参数包含有第二个字符串参数时返回true
8 string-length函数返回字符串的字符数,你应该用<替代<, 用>代替>
9 多个路径可以用分隔符 | 合并在一起
10 descendant (后代)轴包含上下文节点的后代,一个后代是指子节点或者子节点的子节点等等, 因此descendant轴不会包含属性和命名空间节点
11 div运算符做浮点除法运算, mod运算符做求余运算, floor函数返回不大于参数的最大整数(趋近于正无穷), ceiling返回不小于参数的最小整数(趋近于负无穷)
<AAA>
<BBB id=1/>
<CCC/>
<BBB/>
<BBB/>
<DDD>
<BBB/>
</DDD>
<CCC/>
</AAA>
路径: 元素
/AAA 选择根元素AAA
/AAA/CCC 选择所有子元素CCC
/AAA/DDD/BBB 选择子元素DDD中的BBB元素
//BBB 选择所有BBB元素
//DDD/BBB 选择所有父元素是DDD的BBB元素
/AAA/CCC/DDD/* 选中元素BBB
/*/*/*/BBB 选择所有的有3个祖先元素的BBB元素
//* 选择所有
/AAA/BBB[1] 选择第一个BBB
/AAA/BBB[last()] 选择最后一个BBB
//@id 选择所有id属性
//BBB[@id] 选择有id属性的BBB元素
//BBB[@*] 选择具有属性的BBB元素
//BBB[not(@*)] 与上相反
//BBB[@id=1] 选择属性id值等于1的BBB元素
//BBB[normalize-space(@name)='bbb']
//*[count(BBB)=2] 选择含有2个BBB子元素的元素
//*[count(*)=2] 选择含有2个子元素的元素
//*[name()='BBB'] 选择所有名称为BBB的元素(这里等价于//BBB)
//*[starts-with(name(),'B')] 选择所有名称以"B"起始的元素
//*[contains(name(),'C')] 选择所有名称包含"C"的元素
//*[string-length(name()) > 3] 选择名字长度大于3的元素
//CCC | //BBB 选择所有的CCC和BBB元素
/child::AAA/child::BBB 等价于 /AAA/BBB
/descendant::* 选择文档根元素的所有后代.即所有的元素被选择
/AAA/BBB/descendant::* 选择/AAA/BBB的所有后代元素
//CCC/descendant::* 选择在祖先元素中有CCC的所有元素
//CCC/descendant::DDD 选择所有以CCC为祖先元素的DDD元素
//DDD/parent::* 选择DDD元素的所有父节点
/AAA/BBB/DDD/CCC/EEE/ancestor::*
/AAA/BBB/following-sibling::* following-sibling轴(axis)包含上下文节点之后的所有兄弟节点
/AAA/XXX/preceding-sibling::* 与上相反
/AAA/XXX/following::* 包含同一文档中按文档顺序位于上下文节点之后的所有节点, 除了祖先节点,属性节点和命名空间节点
/AAA/XXX/preceding::* 包含同一文档中按文档顺序位于上下文节点之前的所有节点, 除了祖先节点,属性节点和命名空间节点
/AAA/XXX/descendant-or-self::* descendant-or-self 轴(axis)包含上下文节点本身和该节点的后代节点
/AAA/XXX/DDD/EEE/ancestor-or-self::* ancestor-or-self 轴(axis)包含上下文节点本身和该节点的祖先节点
//BBB[position() mod 2 = 0 ] 选择偶数位置的BBB元素
//BBB[ position() = floor(last() div 2 + 0.5) or position() = ceiling(last() div 2 + 0.5) ] 选择中间的BBB元素
分享到:
相关推荐
XPath语法简要说明1
xpath入门教程整理、值得下载、不差这一分、xpath解析xml结构非常牛。
python爬虫xpath学习代码源代码
详尽描述XPath的各种使用方法。让xml操作更简单。
XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。 资料整理来源:...
XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它被广泛应用于XML处理,如XSLT、XQuery以及XPointer等标准中。XPath通过路径表达式来选取XML文档中的元素、属性或其他类型的节点,使得我们可以...
初学者可以下载学习,对xpath的学习很有帮助。初学者可以下载学习,对xpath的学习很有帮助。
XPath 教程是一个系统的学习资源,它包括 XPath 简介、XPath 节点、XPath 语法、XPath 轴、XPath 运算符、XPath 函数、XPath 实例等内容。通过学习 XPath 教程,您将掌握 XPath 的基础知识和应用技能。 因此,XPath...
XML(eXtensible Markup Language)是一种用于标记数据的语言,它设计的目标是传输和存储数据,而不是显示数据。XML的设计原则是易于阅读和编写,同时也...学习这些内容将有助于理解和操作XML文档,提高数据处理能力。
XPath(XML Path Language)是一种在XML文档中查找信息的语言,它是W3C组织制定的一种标准查询语言,用于选取XML文档中的节点,包括元素、属性、文本等。在本项目“Xpath生成器,自动生成XPATH,C#版”中,开发者...
综上所述,这个压缩包提供了从基础到实践的XPath学习资源,包括了理论教程、实战指导和辅助工具。无论是初学者还是经验丰富的开发者,都能从中受益。通过阅读CHM和PDF文件,我们可以系统学习XPath的语法和用法;而...
通过深入研究和理解这个C#小工具的源码,不仅可以提升对XPath的掌握,还能学习到C#中DOM操作和事件处理的相关知识,这对于Web开发或者XML处理的程序员来说是非常宝贵的技能。同时,这也是一次实践面向对象编程、用户...
XPath Helper是一款专为谷歌浏览器设计的...它不仅适合新手学习XPath,也适用于经验丰富的开发者快速调试和优化XPath表达式,大大提升了开发效率。总之,XPath Helper是每个依赖XPath进行网页处理的工作者的理想伴侣。
2. **选择器的使用**:学习如何编写XPath和Css表达式来定位页面上的特定元素,例如,通过id、class、tag name、属性等进行定位。 3. **定位策略**:掌握XPath和Css的不同定位策略,如绝对路径与相对路径,类选择器、...
XPath Helper 是一个强大的工具,主要用于协助开发者在XML或HTML文档中高效地定位和提取数据,尤其在Web爬虫开发中发挥...在学习和使用Python进行Web爬虫开发时,理解并熟练掌握XPath及其相关的库如lxml是至关重要的。
XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点...通过本教程的学习,你应该能够运用XPath有效地在XML文档中导航、选取信息,并在XSL和其他XML相关技术中灵活应用。
XPath Helper是一款非常实用的工具,尤其对于Web开发者和数据抓取者来说,它极大地简化了在网页中查找和提取信息的过程。版本2.0.2是这个插件的一个更新,旨在提供更稳定、高效的功能。XPath(XML Path Language)是...
XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点,包括元素、属性、文本等。XPath基于W3C标准,为XML处理提供了一种强大而灵活的方式。以下是对“XPath指南”中...
XPathHelper是一款强大的XPath工具,主要用于帮助开发者在网页中快速定位并提取HTML元素。XPath是一种在XML文档中查找...通过学习和熟练掌握XPath,我们可以更好地理解和操控HTML文档,提升网页开发和维护的工作效率。