`

xpath路径表达式

    博客分类:
  • XML
 
阅读更多

w3sch:http://www.w3school.com.cn/xpath/xpath_syntax.asp

 

简单说,xpath就是选择XML文件中节点的方法。

所谓节点(node),就是XML文件的最小构成单位,一共分成7种。

- element(元素节点)
- attribute(属性节点)
- text (文本节点)
- namespace (名称空间节点)
- processing-instruction (处理命令节点)
- comment (注释节点)
- root (根节点)

xpath可以用来选择这7种节点。不过,下面的笔记只涉及最常用的第一种element(元素节点),因此可以将下文中的节点和元素视为同义词。

一、xpath表达式的基本格式

xpath通过"路径表达式"(Path Expression)来选择节点。在形式上,"路径表达式"与传统的文件系统非常类似。

# 斜杠(/)作为路径内部的分割符。

# 同一个节点有绝对路径和相对路径两种写法。

# 绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。

# 相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。

# "."表示当前节点。

# ".."表示当前节点的父节点

二、选择节点的基本规则

- nodename(节点名称):表示选择该节点的所有子节点

- "/":表示选择根节点

- "//":表示选择任意位置的某个节点

- "@": 表示选择某个属性

三、选择节点的实例

先看一个XML实例文档。

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

  <book>
    <title lang="eng">Harry Potter</title>
    <price>29.99</price>
  </book>

  <book>
    <title lang="eng">Learning XML</title>
    <price>39.95</price>
  </book>

</bookstore>

[例1]

bookstore :选取 bookstore 元素的所有子节点。

[例2]

/bookstore :选取根节点bookstore,这是绝对路径写法。

[例3]

bookstore/book :选取所有属于 bookstore 的子元素的 book元素,这是相对路径写法。

[例4]

//book :选择所有 book 子元素,而不管它们在文档中的位置。

[例5]

bookstore//book :选择所有属于 bookstore 元素的后代的 book 元素,而不管它们位于 bookstore 之下的什么位置。

[例6]

//@lang :选取所有名为 lang 的属性。

四、xpath的谓语条件(Predicate)

所谓"谓语条件",就是对路径表达式的附加条件。

所有的条件,都写在方括号"[]"中,表示对节点进行进一步的筛选。

[例7]

/bookstore/book[1] :表示选择bookstore的第一个book子元素。

[例8]

/bookstore/book[last()] :表示选择bookstore的最后一个book子元素。

[例9]

/bookstore/book[last()-1] :表示选择bookstore的倒数第二个book子元素。

[例10]

/bookstore/book[position()<3] :表示选择bookstore的前两个book子元素。

[例11]

//title[@lang] :表示选择所有具有lang属性的title节点。

[例12]

//title[@lang='eng'] :表示选择所有lang属性的值等于"eng"的title节点。

[例13]

/bookstore/book[price] :表示选择bookstore的book子元素,且被选中的book元素必须带有price子元素。

[例14]

/bookstore/book[price>35.00] :表示选择bookstore的book子元素,且被选中的book元素的price子元素值必须大于35。

[例15]

/bookstore/book[price>35.00]/title :表示在例14结果集中,选择title子元素。

[例16]

/bookstore/book/price[.>35.00] :表示选择值大于35的"/bookstore/book"的price子元素。

五、通配符

# "*"表示匹配任何元素节点。

# "@*"表示匹配任何属性值。

# node()表示匹配任何类型的节点。

[例17]

//* :选择文档中的所有元素节点。

[例18]

/*/* :表示选择所有第二层的元素节点。

[例19]

/bookstore/* :表示选择bookstore的所有元素子节点。

[例20]

//title[@*] :表示选择所有带有属性的title元素。

六、选择多个路径

用"|"选择多个并列的路径。

[例21]

//book/title | //book/price :表示同时选择book元素的title子元素和price子元素。

分享到:
评论

相关推荐

    XPath路径表达式详解

    "XPath路径表达式详解" XPath 是 W3C 的一个标准,旨在在 XML1.0 或 XML1.1 文档节点树中定位节点。XPath 路径表达式是一种表达式语言,返回值可能是节点、节点集合、原子值或节点和原子值的混合等。XPath2.0 是 ...

    XmlHelper XPath路径表达式选取XML节点

    XPath路径表达式选取XML节点.doc 为XML中常用属性说明 XmlHelper.CS 一个类文件 包括对XML 文件的常规操作 xml字符串转换为dataTable DataTable 转换为xml 找出所有与pPath匹配路径的节点创建dataTable,并设置...

    使用路径表达式在 XML 文档中进行导航(xpath简介)

    ### 使用路径表达式在 XML 文档中进行导航 (XPath 简介) #### 一、XPath 的定义 XPath 是一种用于查找 XML 文档中的信息的语言。它使用路径表达式来选择 XML 文档中的节点或集合节点。XPath 被设计为 XSLT、...

    xpath详解总结-很全面.docx

    当前节点表示当前执行 XPath 路径表达式的环境,父节点表示当前节点的父节点,根元素表示从文档根节点开始执行 XPath 路径表达式,根节点表示文档的根节点。 XPath 在实际应用中非常广泛,例如在 XSLT 和 XQuery 中...

    爬虫第三篇:Xpath 路径表达式全解析:从网页基础到实战应用

    最后通过百度贴吧图片下载这一实战应用,分步骤详细展示了利用 Xpath 进行图片爬取及保存的完整流程,帮助读者理解并掌握 Xpath 在实际爬虫中的运用

    Dom4j结合XPath解析XML文件路径表达式

    XPath(XML Path Language)则是用来在XML文档中查找信息的语言,它允许我们通过路径表达式来选取XML节点,如元素、属性、文本等。本篇文章将深入探讨如何使用Dom4j,一个流行的Java库,结合XPath来解析XML文件中的...

    xpath详解总结,很全面[参照].pdf

    XPath 的知识点包括 XPath 简介、XPath 路径表达式、XPath 在 DOM、XSLT 及 XQuery 中的应用等。 在实际应用中,XPath 可以用来解析 XML 文档,提取所需的信息。XPath 的优点是它可以很方便地定位节点,并且可以很...

    xpath 基础

    2. **路径表达式**:XPath通过路径表达式来选取节点。路径表达式可以是绝对路径(从根节点开始)或相对路径(从当前节点开始)。例如,`/html/body/p`表示从根节点选取HTML文档中的所有段落元素。 3. **轴(Axis)*...

    xpath表达式说明

    1.XPath路径表达式的基本概念 XPath使用路径表达式来选取XML文档中的节点或者节点集。基本的XPath表达式包含有nodename,它用于选取所有特定的子节点。如果路径表达式以正斜杠(/)开始,它表示选择的是从根节点起始的...

    XML Xpath路径详解

    XPath路径表达式用于选择XML文档中的节点或节点集合。它们可以分为以下几种类型: ##### 2.1 绝对路径 绝对路径是从XML文档的根节点开始的路径。这种类型的路径以斜杠`/`开头。例如,`/AAA`表示选择文档的根节点为...

    XPath参考手册中文CHM版最新版本

    XPath 路径表达式 XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。 XPath 标准函数 XPath 含有超过 100 个内建的函数。这些函数用于...

    获取网页上 xpath , css 路径的插件, 方便爬虫、自动化测试相关软件工作者快速获取页面上html元素路径

    XPath路径表达式可以用来找到文档中的一个或多个特定节点。例如,`/html/body/p` 将选取HTML文档中的所有段落元素。浏览器插件可以帮助用户快速生成并复制XPath路径,节省手动编写的时间。 其次,CSS选择器...

    Demo4j和XPath解析XML的文件路径表达式(ZVON.org - X 路径教程)

    XPath使用路径表达式来选取XML文档中的节点,这些路径表达式类似于文件系统中的路径。例如,“/root/element”表示从根节点开始选取名为“element”的子元素。XPath还支持各种轴,如祖先轴(ancestors)、后代轴...

    用XPath 表达式从 XML 文档中提取信息

    XPath使用路径表达式来选取节点,路径表达式的结构类似于文件系统路径。例如,"/bookstore/book"会选取XML文档中所有属于"bookstore"元素的"book"子元素。 XPath表达式的类型主要有以下几种: 1. **绝对路径**:从...

    XPATH参考手册

    XPath 语法包括了 XPath 路径表达式、XPath 标准函数、XPath 轴、XPath 运算符等。XPath 轴是指 XPath 在遍历 XML 文档时使用的路径,XPath 运算符是指 XPath 表达式中使用的运算符,例如等号、不等号、加号、减号等...

    xpath学习笔记 比较入门大家共享

    XPath路径表达式由一系列的路径步骤组成,可以选取XML文档中的特定节点或节点集合。例如,"/bookstore/book"表示选取根元素`bookstore`下的所有`book`元素。路径表达式可以包含轴(如child、attribute等)、节点测试...

    xpath表达式测试小工具

    其基本语法包括路径表达式、轴、节点测试、函数和运算符等。例如,使用“/”表示根节点,“//”表示任何深度的子节点,而“.”则代表当前节点。 这款工具的核心功能可能包括: 1. **输入XML数据**:用户可以输入或...

    无涯教程(LearnFk)-Xpath教程完整离线版.pdf

    XPath路径表达式的功能强大,它可以选择XML文档中的节点或节点列表。 具体到学习和应用中,我们可以看到示例XML文档(students.xml)及其样式表文件(students.xsl)。在这个例子中,XSL文件使用XSL标签的select...

    xpath应用和说明

    以下是对XPath路径表达式关键部分的详细解析: - **绝对路径**:以斜杠`/`开始,从根节点选取。例如,`/root/table`表示选取根节点下的第一个`table`元素。 - **相对路径**:使用双斜杠`//`,可以在文档中的任何...

    XPath教程 ppt

    XPath简介 XPath术语 XPath语法 XPath路径表达式 XPath运算符

Global site tag (gtag.js) - Google Analytics