`

XPath语法

阅读更多


XPath 简单语法

  XPath XML 的查询语言,和 SQL 的角色很类似。以下面 XML 为例,介绍 XPath 的语法。

<?xml version="1.0" encoding="ISO-8859-1"?>
<catalog>
  <cd country="USA">
    <title>Empire Burlesque</title>
    <artist>Bob Dylan</artist>
    <price>10.90</price>
  </cd>
  <cd country="UK">
    <title>Hide your heart</title>
    <artist>Bonnie Tyler</artist>
    <price>9.90</price>
  </cd>
  <cd country="USA">
    <title>Greatest Hits</title> 
    <artist>Dolly Parton</artist> 
    <price>9.90</price> 
  </cd>
</catalog>
  • 定位节点  

       XML 是树状结构,类似档案系统内数据夹的结构, XPath 也类似档案系统的路径命名方式。不过 XPath 是一种模式 (Pattern) ,可以选出 XML 档案中,路径符合某个模式的所有节点出来。

 

      例如要选 catalog 底下的 cd 中所有 price 元素可以用:   

 

/catalog/cd/price 

      如果 XPath 的开头是一个斜线( / )代表这是绝对路径。如果开头是两个斜线( // )表示文件中所有符合模式的元素都会被选出来,即使是处于树中不同的层级也会被选出来。

 

      以下的语法会选出文件中所有叫做 cd 的元素(在树中的任何层级都会被选出来):

 

//cd
 
  • 选择未知的元素  

       使用星号(Wildcards,*)可以选择未知的元素。

 

       下面这个语法会选出/catalog/cd 的所有子元素:

/catalog/cd/*

 

        以下的语法会选出所有catalog的子元素中,包含有price作为子元素的元素。

/catalog/*/price

 

       以下的语法会选出有两层父节点,叫做price的所有元素。

 
/*/*/price


      以下的语法会选择出文件中的所有元素。

//*
 


      要注意的是,想要存取不分层级的元素,XPath语法必须以两个斜线开头(//),想要存取未知元素才用星号(*),星号只能代表未知名称的元素,不能代表未知层级的元素。

  • 选择分支

      使用中括号可以选择分支。以下的语法从catalog的子元素中取出第一个叫做cd的元素。XPath的定义中没有第0元素这种东西。

/catalog/cd[1]
 


 

      以下语法选择catalog中的最后一个cd元素:(XPathj并没有定义 first() 这种函式喔,用上例的 [1]就可以取出第一个元素。

/catalog/cd[last()]


 

 

      以下语法选出含有price子元素的所有/catalog/cd元素。

/catalog/cd[price]
 


 

      以下语法选出price元素的值等于10.90的所有/catalog/cd元素

/catalog/cd[price=10.90]
 


 

      以下语法选出price元素的值等于10.90的所有/catalog/cd元素 的price元素

/catalog/cd[price=10.90]/price
 

 

  • 选择一个以上的路径

      使用Or操作数(|)就可以选择一个以上的路径。例如:

/catalog/cd/title | catalog/cd/artist
 


 

      选择所有title以及artist元素

//title | //artist
 


 

      选择所有title以及artist以及price元素

//title | //artist | //price
 

 

  • 选择属性

      在XPath中,除了选择元素以外,也可以选择属性。属性都是以@开头。例如选择文件中所有叫做country的属性:

//@country
 


        

      选择所有含有country这个属性的cd元素:

//cd[@country]
 


        

      以下语法选择出含有属性的所有cd元素

//cd[@*]
 


        

      以下语法选择出country属性值为UK的cd元素

//cd[@country='UK']
分享到:
评论

相关推荐

    C#操作xml之xpath语法

    ### C#操作XML之XPath语法详解 在C#中,操作XML文档是一项常见的任务,尤其在处理配置文件、数据交换格式或集成不同系统时。为了有效地解析和查询XML数据,XPath成为了一种不可或缺的语言。本文将深入探讨XPath的...

    Python3 xml.etree.ElementTree支持的XPath语法详解

    通过这些基本语法,我们可以编写XPath表达式来精确地查找XML文档中的特定部分。例如,在给定的XML文档中,我们可以找到每个国家的名称: ```python root = ET.fromstring(xml_string) for country in root.findall...

    XPath语法详细介绍..XPath语法详细介绍

    ### XPath语法详细介绍 #### XPath简介 XPath是一种用于在XML文档中进行导航的查询语言。它提供了简洁、高效的方式来定位和提取文档中的特定部分。XPath不仅仅适用于XML文档的搜索,还是XSLT(一种用于转换XML文档...

    xpath语法与函数

    ### XPath语法与函数知识点 #### XPath简介 XPath是一种在XML文档中查找信息的语言。它主要用于在XML文档中通过元素和属性进行导航。XPath是XSLT标准中的关键组成部分,同时也是XQuery和XPointer的基础。 #### ...

    XPath 语法(MSDN)

    XPath语法中的关键概念包括: 1. **路径表达式**:如同文件系统的路径,XPath使用路径来定位节点。例如,`/bookstore/book`表示从文档根开始选取`&lt;bookstore&gt;`元素下的所有`&lt;book&gt;`元素。 2. **运算符和特殊字符**...

    Xpath 语法生成器(插件).zip

    XPath语法生成器是一种实用工具,尤其是对于开发人员和数据分析师来说,它能简化在网页抓取过程中定位元素的工作。 这个名为“XPath Helper”的插件是专门为浏览器设计的,它使得用户能够在浏览网页时实时生成和...

    Xpath语法.docx

    Xpath语法.docx

    xpath的语法

    XPath语法的核心概念包括: 1. **节点类型**:XPath中的节点包括元素(element)、属性(attribute)、文本(text)、命名空间(namespace)、处理指令(processing-instruction)、注释(comment)和文档...

    XPath语法简要说明1

    XPath语法简要说明1

    XPath语法详解xml开发必备

    下面我们将详细探讨XPath语法及其在XML开发中的应用。 1. **XPath的基本概念** - **节点**:XML文档由一系列节点构成,如元素(element)、属性(attribute)、文本(text)、命名空间(namespace)、处理指令...

    xpath 的语法

    XPath 语法 XPath(XML Path Language)是一种用于选择 XML 文档中节点的语言。它提供了一种灵活的方式来定位和选择 XML 文档中的节点,从而能够快速地访问和处理 XML 文档。 在 XPath 中,节点是以树形结构组织的...

    xpath语法详解

    XPath的语法基础: 1. **节点类型**:XPath定义了七种基本的节点类型,包括元素(element)、属性(attribute)、文本(text)、命名空间(namespace)、处理指令(processing-instruction)、注释(comment)以及...

    Python-astpath一个命令行工具用于使用XPath语法查询PythonASTs

    astpath:一个命令行工具用于使用XPath语法查询Python ASTs

    Python爬虫基础之XPath语法与lxml库的用法详解

    主要给大家介绍了关于Python爬虫基础之XPath语法与lxml库用法的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

    XPath语法20130920

    XPath语法 XPath(XML Path Language)是一种用于选择XML文档中节点或节点集的语言。它使用路径表达式来选取节点,节点是通过沿着路径(path)或者步(steps)来选取的。 XPath的基本概念: * 节点:XML文档中的...

    xpath 语法测试

    总结来说,"xpath 语法测试"提供了一个实践XPath的环境,结合Web服务、jQuery和AJAX,展示了XPath在现代Web开发中的应用。通过这个测试,开发者可以提升XPath技能,更有效地处理XML数据,提高代码的效率和可读性。

    Xpath生成器,自动生成XPATH,C#版

    XPath(XML Path Language)是一种在XML文档中查找信息的语言,它是W3C组织制定的一种标准查询语言,用于选取XML文档中的节点,包括元素、属性、文本等。在本项目“Xpath生成器,自动生成XPATH,C#版”中,开发者...

    Python使用xpath实现图片爬取

    首先,让我们了解基本的XPath语法。XPath通过路径表达式来选取XML或HTML文档中的节点。例如,`//div[@class="slist"]/ul//a/@href`这个表达式选取了所有`class`属性值为`slist`的`div`元素下的`ul`元素内的`a`元素的...

    XPath教程

    本教程将深入探讨XPath的核心概念、语法以及实际应用。 XPath的主要目标是提供一种简洁而有效的机制,使得XML文档的某一部分可以被快速定位。在XSL(Extensible Stylesheet Language,可扩展样式表语言)中,XPath...

Global site tag (gtag.js) - Google Analytics