`

常用的XPath表达式

 
阅读更多

一些常用的XPath表达式:

/catalog/cd/price   

如果XPath的开头是一个斜线(/)代表这是绝对路径。如果开头是两个斜线(//)表示文件中所有符合模式的元素都会被选出来,即使是处于树中不同的层级也会被选出来。以下的语法会选出文件中所有叫做cd的元素(在树中的任何层级都会被选出来):


//cd

选择未知的元素
使用星号(Wildcards,*)可以选择未知的元素。下面这个语法会选出/catalog/cd 的所有子元素:


/catalog/cd/*

以下的语法会选出所有catalog的子元素中,包含有price作为子元素的元素。


/catalog/*/price

以下的语法会选出有两层父节点,叫做price的所有元素。


/*/*/price

以下的语法会选择出文件中的所有元素。


//*

要注意的是,想要存取不分层级的元素,XPath语法必须以两个斜线开头(//),想要存取未知元素才用星号(*),星号只能代表未知名称的元素,不能代表未知层级的元素。

选择分支
使用中括号可以选择分支。以下的语法从catalog的子元素中取出第一个叫做cd的元素。XPath的定义中没有第0元素这种东西。


/catalog/cd[1]

以下语法选择catalog中的最后一个cd元素:(XPathj并没有定义 first() 这种函式喔,用上例的 [1]就可以取出第一个元素。


/catalog/cd[last()]

以下语法选出含有price子元素的所有/catalog/cd元素。


/catalog/cd[price]

以下语法选出price元素的值等于10.90的所有/catalog/cd元素


/catalog/cd[price=10.90]

以下语法选出price元素的值等于10.90的所有/catalog/cd元素 的price元素


/catalog/cd[price=10.90]/price

选择一个以上的路径
使用Or操作数( ¦)就可以选择一个以上的路径。例如:


/catalog/cd/title ¦ catalog/cd/artist

选择所有title以及artist元素


//title ¦ //artist

选择所有title以及artist以及price元素


//title ¦ //artist ¦ //price

选择属性
在XPath中,除了选择元素以外,也可以选择属性。属性都是以@开头。例如选择文件中所有叫做country的属性:


//@country
       
选择所有含有country这个属性的cd元素:


//cd[@country]
       
以下语法选择出含有属性的所有cd元素


//cd[@*]
       
以下语法选择出country属性值为UK的cd元素


//cd[@country='UK']

分享到:
评论

相关推荐

    用XPath 表达式从 XML 文档中提取信息

    XPath表达式是用于定位这些节点的语句,它们允许开发者高效地从复杂的XML数据结构中提取所需信息。 在XML文档中,每个元素、属性和文本都有一个唯一的路径,XPath就是通过这个路径来找到它们。XPath使用路径表达式...

    xpath表达式测试小工具

    这款“XPath表达式测试小工具”显然是为了帮助开发者和XML爱好者更方便地测试和验证XPath表达式的正确性。 在XML文档中,XPath表达式可以用来选取节点集、单个节点、文本值或者布尔值。其基本语法包括路径表达式、...

    Xpath 表达式教程

    XPath表达式的基本构成: 1. **当前上下文**:使用`.`和`/`表示当前节点作为上下文。例如,`./author`会选取当前节点下的所有`<author>`元素。 2. **文档根**:以单个`/`开头的表达式表示从文档根开始选取。例如,`/...

    xpath表达式基本格式

    .XPath 表达式基本格式 XPath 表达式是选择 XML 文件中节点的方法,节点是 XML 文件的最小构成单位,分为 7 种:element(元素节点)、attribute(属性节点)、text (文本节点)、namespace (名称空间节点)、...

    XPath路径表达式详解

    "XPath路径表达式详解" XPath 是 W3C 的一个标准,旨在在 XML1.0 或 XML1.1 文档节点树中定位节点。XPath 路径表达式是一种表达式语言,返回值可能是节点、节点集合、原子值或节点和原子值的混合等。XPath2.0 是 ...

    Python xpath表达式如何实现数据处理

    xpath表达式 1. xpath语法 <title lang=eng>Harry Potter</title> <price>999 <title lang=eng>Learning XML</title> <price>888 1.1 选取节点 XPath 使用路径表达式来选取 ...

    xpath表达式完整实例

    ### Xpath表达式完整实例知识点解析 #### 一、Xpath基本概念 Xpath是一种用于在XML文档中查询和定位节点的语言。它提供了一种简洁有效的方式来选择文档中的元素和属性。 - **节点类型**: - **Element(元素节点...

    表达式验证1.0[正则,xpath测试]

    在"表达式验证1.0"中,开发者可以输入XPath表达式,结合XML样本数据进行测试。工具会返回匹配的节点,方便用户验证查询是否正确。 该工具基于.NET Framework 3.5,这是一个由Microsoft开发的成熟且广泛使用的框架,...

    xpath表达式说明

    根据提供的文件信息,我们可以了解到XPath表达式的几个重要知识点: 1.XPath路径表达式的基本概念 XPath使用路径表达式来选取XML文档中的节点或者节点集。基本的XPath表达式包含有nodename,它用于选取所有特定的子...

    使用HtmlAgilityPack XPath 表达式抓取博客园数据的实现代码

    至于XPath表达式,它是通过一系列的路径规则来指定具体的节点或节点集。当与HtmlAgilityPack结合使用时,可以通过XPath表达式来精确地获取我们所需要的数据。 在实际应用中,可以通过WebClient类下载网页数据,然后...

    Xpath生成器,自动生成XPATH,C#版

    在本项目“Xpath生成器,自动生成XPATH,C#版”中,开发者提供了一个工具,能够帮助用户快速生成适用于C#编程环境的XPath表达式。 XPath的工作原理是通过路径表达式来选取XML文档中的节点。路径表达式可以理解为...

    SoftXpath:SoftXPath 是一个小型的跨浏览器 JavaScript 库,用于使用强大的 Xpath 表达式在客户端解析复杂的 XML 文档。 专注于构建有效的 Xpath 表达式,而不是在浏览器兼容性问题上浪费时间

    软X路径SoftXPath是一个小型的跨浏览器 JavaScript 库,用于使用强大的Xpath表达式在客户端解析复杂的 XML 文档。 专注于构建有效的 Xpath 表达式,而不是在浏览器兼容性问题上浪费时间。支持的浏览器:SoftXPath ...

    xpath_helper_2_0_2.rar

    这款插件能够实时显示XPath表达式的匹配结果,使得开发者和数据分析师在处理复杂的网页结构时更加得心应手。 XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它通过路径表达式来选取XML文档中...

    谷歌浏览器插件 xpath helper

    3. **保存常用查询**:可以保存常用的XPath表达式,方便日后重复使用。 4. **复制结果**:轻松复制选取的元素的文本内容或XPath路径,便于进一步处理。 5. **兼容性**:除了HTML,XPath Helper也支持XML文档的查询,...

    xpath-helper插件

    这款插件能够帮助开发者和网页爬虫工程师快速编写和测试XPath表达式,提高工作效率。 XPath Helper的核心功能: 1. 实时预览:用户在输入XPath表达式后,插件会立即高亮显示匹配的页面元素,直观地呈现查询结果,...

    XPath Checker使用

    XPath Checker 是一款非常实用的 Firefox 浏览器插件,它可以帮助用户快速检查网页中的 XPath 表达式是否正确,以及这些表达式是否能匹配到预期的元素。这对于进行 Web 自动化测试、数据抓取等操作时特别有用,因为...

    XPath-Helper

    XPath-Helper是一款针对XPath查询的高效工具,特别为谷歌浏览器设计,极大地简化了网页元素的选择和XPath表达式的构建过程。 在网页开发、自动化测试、数据抓取等领域,XPath-Helper扮演着至关重要的角色。通过安装...

    xpath helper2.rar

    它在版本2.0.2中提供了更稳定和高效的性能,使得开发者能够更便捷地利用XPath表达式来定位和提取所需的数据,尤其在网页抓取(爬虫)领域中发挥着重要作用。 XPath,全称XML Path Language,是一种在XML文档中查找...

Global site tag (gtag.js) - Google Analytics