- 浏览: 79510 次
- 性别:
- 来自: 北京
最新评论
-
liguangge285:
和lz一样的命运,坑爹的ipo
坑爹的A股 -
ceasarje:
说的也是,呵呵,这个一般在开发复杂的企业级系统和大规模集成应用 ...
关于JMS的介绍和总结 -
releasa:
没机会实际用。。
关于JMS的介绍和总结 -
ceasarje:
fansfirst2008 写道楼主过程思维很强!但是很不面向 ...
java二维数组操作实例 -
fansfirst2008:
楼主过程思维很强!但是很不面向对象,从你考别人的问题也可以看出 ...
java二维数组操作实例
XML 文档对象模型 (DOM)
能够以编程方式读取、处理和修改 XML 文档。
XPath 表达式
XPath 表达式使用路径表示法(与 URL 中使用的路径表示法类似)寻址 XML 文档的各个部分。表达式计算为生成子元素集、布尔值、数字或字符串类型的对象。
URL与XPath 表达式比较
URL: 由文件系统中的文件夹和文件组成的层次结构。
每个级别具有唯一名称的文件。URL 总是标识单个文件。
相对特定文件夹(称为“当前文件夹”)进行计算。
XPath: 由 XML 文档中的元素和其他元素组成的层次结构。
每个级别的元素名可能不是唯一的。XPath 表达式标识所有匹配的元素集。
相对特定元素(称为表达式的“上下文”)进行计算。
基本 XPath 表达式 (判断是谁的集合!!)
1.当前上下文
以句点和正斜杠 (./) 作为前缀的表达式明确使用当前上下文作为上下文。例如,以下表达式引用当前上下文中的所有 <author> 元素:
./author
注意,此表达式等效于以下表达式:
author
2.文档根
以正斜杠 (/) 为前缀的表达式使用文档树的根作为上下文。例如,以下表达式引用此文档根的 <bookstore> 元素:
/bookstore
3.根元素
使用正斜杠后接星号 (/*) 的表达式将使用根元素作为上下文。例如,以下表达式查找文档的根元素:
/*
4.递归下降
用双正斜杠 (//) 的表达式指示可以包括零个或多个层次结构级别的搜索。如果此运算符出现在模式的开头,上下文相对于文档的根。例如,以下表达式引用当前文档中任意位置的所有 <author> 元素:
//author
.// 前缀指示上下文从层次结构中当前上下文所指示的级别开始。
5.特定元素
以元素名开头的表达式引用特定元素的查询,从当前上下文节点开始。例如,以下表达式引用当前上下文节点中 <images> 元素内的 <background.jpg> 元素:
images/background.jpg
以下表达式引用当前上下文节点中 <bookstore> 元素内的 <book> 元素的集合:
bookstore/book
以下表达式引用当前上下文节点中的所有 <first.name> 元素:
first.name
XPath 表达式是使用下表中所示的运算符和特殊字符构造的。
运算符和特殊字符:
/ 子运算符;选择左侧集合的直接子级。此路径运算符出现在模式开头时,表示应从根节点选择该子级。
// 递归下降;在任意深度搜索指定元素。此路径运算符出现在模式开头时,表示应从根节点递归下降。
. 指示当前上下文。
.. 当前上下文节点的父级。
* 通配符;选择所有元素,与元素名无关。
@ 属性;属性名的前缀。
@* 属性通配符;选择所有属性,与名称无关。
: 命名空间分隔符;将命名空间前缀与元素名或属性名分隔。
( ) 为运算分组,明确设置优先级。
[ ] 应用筛选模式。
[ ] 下标运算符;用于在集合中编制索引。
+ 执行加法。
- 执行减法。
div 根据 IEEE 754 执行浮点除法。
* 执行乘法。
mod 从截断除法返回余数。
优先级 字符 用途
1 ( ) 分组
2 [ ] 筛选器
3 / // 路径运算
分组运算符()仅适用于顶级路径表达式。
例如:
(//author/degree | //author/name) 是有效的分组运算
//author/(degree | name) 不是有效的分组运算
筛选模式运算符 [] 的优先级高于路径运算符(/ 和 //)。
例如:
//comment()[3]
选择相对于文档中任意位置comment的父级索引等于3的所有comment,可以返回多个备注
(//comment())[3]
选择相对于父级的所有comment集中的第三个comment,只能返回一个备注。
author/first-name
当前上下文节点的 <author> 元素中的所有 <first-name> 元素。
bookstore//title
<bookstore> 元素中更深的一级或多级(任意子代)的所有 <title> 元素。注意,此表达式与以下模式 bookstore/*/title 不同。
bookstore/*/title
属于 <bookstore> 元素的孙级的所有 <title> 元素。
bookstore//book/excerpt//emph
<book> 元素的 <excerpt> 子级中的任意位置和 <bookstore> 元素中的任意位置的所有 <emph> 元素:
.//title
当前上下文中更深的一级或多级的所有 <title> 元素。注意,本质上只有这种情况需要句点表示法。
通配符
通过使用通配符 * 集合,不使用元素名即可引用元素。* 集合引用作为当前上下文的子级的所有元素,与名称无关。
例如:
author/*
<author> 元素的所有元素子级。
book/*/last-name
所有作为 <book> 元素的孙级的 <last–name> 元素。
*/*
当前上下文的所有孙级元素。
my:book
my 命名空间中的 <book> 元素。
my:*
my 命名空间中的所有元素。
属性
XPath 使用 @ 符号表示属性名。属性和子元素应公平对待,两种类型之间的功能应尽可能相当。
例如:
@style
当前元素上下文的 style 属性。
price/@exchange
当前上下文中 <price> 元素的 exchange 属性。
book/@style
所有 <book> 元素的 style 属性。
@*
当前上下文节点的所有属性。
@my:*
my 命名空间中的所有属性。不包括 my 命名空间中的元素的未限定属性。
注意:
属性不能包含子元素,所以,如果对属性应用路径运算符,将出现语法错误。此外,不能对属性应用索引,因为根据定义,不为属性定义任何顺序。
price/@exchange/total
比较
运算符:
and 逻辑与
or 逻辑或
not() 非
= 相等
!= 不相等
< 小于
<= 小于或等于
> 大于
<= 大于或等于
| 集运算;返回两个节点集的联合
例如:
author[last-name = "Bob"]
至少包含一个值为 Bob 的 <last-name> 元素的所有 <author> 元素。
author[last-name[1] = "Bob"]
第一个 <last-name> 子元素的值为 Bob 的所有 <author> 元素。
author/degree[@from != "Harvard"]
包含 from 属性不等于 "Harvard" 的 <degree> 元素的所有 <author> 元素。
author[last-name = /editor/last-name]
包含与根元素下 <editor> 元素中的 <last-name> 元素相同的 <last-name> 元素的所有 <author> 元素。
author[. = "Matthew Bob"]
所有字符串值为 Matthew Bob 的 <author> 元素。
集运算
Union (|) 运算符
|(即 union)运算符返回两个操作数的联合,操作数必须是节点集。例如,//author | //publisher 返回的节点集结合了所有 //author 节点和所有 //publisher 节点。
例如:
first-name | last-name
包含当前上下文中的 <first-name> 和 <last-name> 元素的节点集。
(bookstore/book | bookstore/magazine)
包含 <bookstore> 元素中的 <book> 或 <magazine> 元素的节点集。
book | book/author
包含 <book> 元素中的所有 <book> 元素和所有 <author> 元素的节点集。
(book | magazine)/price
包含 <book> 或 <magazine> 元素的所有 <price> 元素的节点集。
筛选器和筛选模式
通过将筛选子句 [pattern] 添加到集合中,可以对任何集合应用约束和分支。筛选器类似于 SQL WHERE 子句。筛选器中包含的模式称为“筛选模式”。
例如:
book[excerpt]
至少包含一个 <excerpt> 元素的所有 <book> 元素。
book[excerpt]/title
至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <title> 元素。
book[excerpt]/author[degree]
至少包含一个 <degree> 元素并且在至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <author> 元素。
book[author/degree]
至少包含一个 <author> 元素并且该元素至少包含一个 <degree> 子元素的 <book> 所有元素。
book[excerpt][title]
至少包含一个 <excerpt> 元素以及至少包含一个 <title> 元素的 <book> 所有元素。
能够以编程方式读取、处理和修改 XML 文档。
XPath 表达式
XPath 表达式使用路径表示法(与 URL 中使用的路径表示法类似)寻址 XML 文档的各个部分。表达式计算为生成子元素集、布尔值、数字或字符串类型的对象。
URL与XPath 表达式比较
URL: 由文件系统中的文件夹和文件组成的层次结构。
每个级别具有唯一名称的文件。URL 总是标识单个文件。
相对特定文件夹(称为“当前文件夹”)进行计算。
XPath: 由 XML 文档中的元素和其他元素组成的层次结构。
每个级别的元素名可能不是唯一的。XPath 表达式标识所有匹配的元素集。
相对特定元素(称为表达式的“上下文”)进行计算。
基本 XPath 表达式 (判断是谁的集合!!)
1.当前上下文
以句点和正斜杠 (./) 作为前缀的表达式明确使用当前上下文作为上下文。例如,以下表达式引用当前上下文中的所有 <author> 元素:
./author
注意,此表达式等效于以下表达式:
author
2.文档根
以正斜杠 (/) 为前缀的表达式使用文档树的根作为上下文。例如,以下表达式引用此文档根的 <bookstore> 元素:
/bookstore
3.根元素
使用正斜杠后接星号 (/*) 的表达式将使用根元素作为上下文。例如,以下表达式查找文档的根元素:
/*
4.递归下降
用双正斜杠 (//) 的表达式指示可以包括零个或多个层次结构级别的搜索。如果此运算符出现在模式的开头,上下文相对于文档的根。例如,以下表达式引用当前文档中任意位置的所有 <author> 元素:
//author
.// 前缀指示上下文从层次结构中当前上下文所指示的级别开始。
5.特定元素
以元素名开头的表达式引用特定元素的查询,从当前上下文节点开始。例如,以下表达式引用当前上下文节点中 <images> 元素内的 <background.jpg> 元素:
images/background.jpg
以下表达式引用当前上下文节点中 <bookstore> 元素内的 <book> 元素的集合:
bookstore/book
以下表达式引用当前上下文节点中的所有 <first.name> 元素:
first.name
XPath 表达式是使用下表中所示的运算符和特殊字符构造的。
运算符和特殊字符:
/ 子运算符;选择左侧集合的直接子级。此路径运算符出现在模式开头时,表示应从根节点选择该子级。
// 递归下降;在任意深度搜索指定元素。此路径运算符出现在模式开头时,表示应从根节点递归下降。
. 指示当前上下文。
.. 当前上下文节点的父级。
* 通配符;选择所有元素,与元素名无关。
@ 属性;属性名的前缀。
@* 属性通配符;选择所有属性,与名称无关。
: 命名空间分隔符;将命名空间前缀与元素名或属性名分隔。
( ) 为运算分组,明确设置优先级。
[ ] 应用筛选模式。
[ ] 下标运算符;用于在集合中编制索引。
+ 执行加法。
- 执行减法。
div 根据 IEEE 754 执行浮点除法。
* 执行乘法。
mod 从截断除法返回余数。
优先级 字符 用途
1 ( ) 分组
2 [ ] 筛选器
3 / // 路径运算
分组运算符()仅适用于顶级路径表达式。
例如:
(//author/degree | //author/name) 是有效的分组运算
//author/(degree | name) 不是有效的分组运算
筛选模式运算符 [] 的优先级高于路径运算符(/ 和 //)。
例如:
//comment()[3]
选择相对于文档中任意位置comment的父级索引等于3的所有comment,可以返回多个备注
(//comment())[3]
选择相对于父级的所有comment集中的第三个comment,只能返回一个备注。
author/first-name
当前上下文节点的 <author> 元素中的所有 <first-name> 元素。
bookstore//title
<bookstore> 元素中更深的一级或多级(任意子代)的所有 <title> 元素。注意,此表达式与以下模式 bookstore/*/title 不同。
bookstore/*/title
属于 <bookstore> 元素的孙级的所有 <title> 元素。
bookstore//book/excerpt//emph
<book> 元素的 <excerpt> 子级中的任意位置和 <bookstore> 元素中的任意位置的所有 <emph> 元素:
.//title
当前上下文中更深的一级或多级的所有 <title> 元素。注意,本质上只有这种情况需要句点表示法。
通配符
通过使用通配符 * 集合,不使用元素名即可引用元素。* 集合引用作为当前上下文的子级的所有元素,与名称无关。
例如:
author/*
<author> 元素的所有元素子级。
book/*/last-name
所有作为 <book> 元素的孙级的 <last–name> 元素。
*/*
当前上下文的所有孙级元素。
my:book
my 命名空间中的 <book> 元素。
my:*
my 命名空间中的所有元素。
属性
XPath 使用 @ 符号表示属性名。属性和子元素应公平对待,两种类型之间的功能应尽可能相当。
例如:
@style
当前元素上下文的 style 属性。
price/@exchange
当前上下文中 <price> 元素的 exchange 属性。
book/@style
所有 <book> 元素的 style 属性。
@*
当前上下文节点的所有属性。
@my:*
my 命名空间中的所有属性。不包括 my 命名空间中的元素的未限定属性。
注意:
属性不能包含子元素,所以,如果对属性应用路径运算符,将出现语法错误。此外,不能对属性应用索引,因为根据定义,不为属性定义任何顺序。
price/@exchange/total
比较
运算符:
and 逻辑与
or 逻辑或
not() 非
= 相等
!= 不相等
< 小于
<= 小于或等于
> 大于
<= 大于或等于
| 集运算;返回两个节点集的联合
例如:
author[last-name = "Bob"]
至少包含一个值为 Bob 的 <last-name> 元素的所有 <author> 元素。
author[last-name[1] = "Bob"]
第一个 <last-name> 子元素的值为 Bob 的所有 <author> 元素。
author/degree[@from != "Harvard"]
包含 from 属性不等于 "Harvard" 的 <degree> 元素的所有 <author> 元素。
author[last-name = /editor/last-name]
包含与根元素下 <editor> 元素中的 <last-name> 元素相同的 <last-name> 元素的所有 <author> 元素。
author[. = "Matthew Bob"]
所有字符串值为 Matthew Bob 的 <author> 元素。
集运算
Union (|) 运算符
|(即 union)运算符返回两个操作数的联合,操作数必须是节点集。例如,//author | //publisher 返回的节点集结合了所有 //author 节点和所有 //publisher 节点。
例如:
first-name | last-name
包含当前上下文中的 <first-name> 和 <last-name> 元素的节点集。
(bookstore/book | bookstore/magazine)
包含 <bookstore> 元素中的 <book> 或 <magazine> 元素的节点集。
book | book/author
包含 <book> 元素中的所有 <book> 元素和所有 <author> 元素的节点集。
(book | magazine)/price
包含 <book> 或 <magazine> 元素的所有 <price> 元素的节点集。
筛选器和筛选模式
通过将筛选子句 [pattern] 添加到集合中,可以对任何集合应用约束和分支。筛选器类似于 SQL WHERE 子句。筛选器中包含的模式称为“筛选模式”。
例如:
book[excerpt]
至少包含一个 <excerpt> 元素的所有 <book> 元素。
book[excerpt]/title
至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <title> 元素。
book[excerpt]/author[degree]
至少包含一个 <degree> 元素并且在至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <author> 元素。
book[author/degree]
至少包含一个 <author> 元素并且该元素至少包含一个 <degree> 子元素的 <book> 所有元素。
book[excerpt][title]
至少包含一个 <excerpt> 元素以及至少包含一个 <title> 元素的 <book> 所有元素。
发表评论
-
Python获取A股上市公司财报数据
2020-11-09 17:45 1890'''import pandas as pd import ... -
VLookup实用case
2020-05-13 13:47 309AllRecords InHandRec ... -
JSON字符串和对象
2020-04-28 10:03 292JSON 语法 每个数据之间由逗号分隔; 数据使用" ... -
java的加减乘除运算
2019-10-10 14:49 415https://www.cnblogs.com/luckyli ... -
Groovy对XML的处理
2019-05-09 15:49 445https://blog.csdn.net/russle/ar ... -
Groovy学习参考
2019-05-09 15:43 383基本使用 https://blog.csdn.net/Al_a ... -
Groovy的循环
2019-05-09 15:03 4601、for-each循环。 (1) 使用冒号形式的for循环, ... -
Groovy对Json的常见处理
2019-05-09 14:36 15401、JsonBuilder构建 示例1, people = ... -
基于HmacSHA256的安全令牌
2017-07-31 10:07 602Mac sha256_HMAC = null; ... -
趣谈HTTPS
2016-09-13 11:28 537HTTPS 是我们常见的 HTTP 协议与某个加密协议的混合体 ... -
realVNC操作SLES 11 SP3
2016-03-10 21:16 5441. 通过ps -p $$可以知道系统内 ... -
REST VS SOAP
2016-01-18 10:17 430REST是一种架构风格, ... -
udf直接抛异常,强制中断映射.
2015-11-30 20:42 1019if("123".equals(var ... -
<转>SSL和Https协议
2014-10-15 23:05 721把这几天学习到的关于s ... -
Resend messages one by one
2014-05-04 12:42 578You can do that way when the ba ... -
<转>公钥,私钥和数字签名
2014-04-30 14:53 737一、公钥加密 假设一 ... -
Java IO写文件读多少写多少
2014-04-22 13:34 603读写文件的时候经常会碰到写的文件和读的文件不一样导致各种各样的 ... -
5 ways to improve you communication skills.
2013-08-27 14:25 852Communication skills are part o ... -
在Eclipse 3.2里安装Jadclipse/Jad插件
2013-05-27 00:36 812几点注意事项: 1.下载好jadclipse_3.2.0.j ... -
XPath实验笔记
2012-11-18 17:49 9291.手动定义一个XML文档时发现一定需要有一个根节点,根节点的 ...
相关推荐
XPath表达式是用于定位这些节点的语句,它们允许开发者高效地从复杂的XML数据结构中提取所需信息。 在XML文档中,每个元素、属性和文本都有一个唯一的路径,XPath就是通过这个路径来找到它们。XPath使用路径表达式...
这款“XPath表达式测试小工具”显然是为了帮助开发者和XML爱好者更方便地测试和验证XPath表达式的正确性。 在XML文档中,XPath表达式可以用来选取节点集、单个节点、文本值或者布尔值。其基本语法包括路径表达式、...
XPath表达式的基本构成: 1. **当前上下文**:使用`.`和`/`表示当前节点作为上下文。例如,`./author`会选取当前节点下的所有`<author>`元素。 2. **文档根**:以单个`/`开头的表达式表示从文档根开始选取。例如,`/...
.XPath 表达式基本格式 XPath 表达式是选择 XML 文件中节点的方法,节点是 XML 文件的最小构成单位,分为 7 种:element(元素节点)、attribute(属性节点)、text (文本节点)、namespace (名称空间节点)、...
### Xpath表达式完整实例知识点解析 #### 一、Xpath基本概念 Xpath是一种用于在XML文档中查询和定位节点的语言。它提供了一种简洁有效的方式来选择文档中的元素和属性。 - **节点类型**: - **Element(元素节点...
xpath表达式 1. xpath语法 <title lang=eng>Harry Potter</title> <price>999 <title lang=eng>Learning XML</title> <price>888 1.1 选取节点 XPath 使用路径表达式来选取 ...
根据提供的文件信息,我们可以了解到XPath表达式的几个重要知识点: 1.XPath路径表达式的基本概念 XPath使用路径表达式来选取XML文档中的节点或者节点集。基本的XPath表达式包含有nodename,它用于选取所有特定的子...
在"表达式验证1.0"中,开发者可以输入XPath表达式,结合XML样本数据进行测试。工具会返回匹配的节点,方便用户验证查询是否正确。 该工具基于.NET Framework 3.5,这是一个由Microsoft开发的成熟且广泛使用的框架,...
至于XPath表达式,它是通过一系列的路径规则来指定具体的节点或节点集。当与HtmlAgilityPack结合使用时,可以通过XPath表达式来精确地获取我们所需要的数据。 在实际应用中,可以通过WebClient类下载网页数据,然后...
软X路径SoftXPath是一个小型的跨浏览器 JavaScript 库,用于使用强大的Xpath表达式在客户端解析复杂的 XML 文档。 专注于构建有效的 Xpath 表达式,而不是在浏览器兼容性问题上浪费时间。支持的浏览器:SoftXPath ...
"XPath路径表达式详解" XPath 是 W3C 的一个标准,旨在在 XML1.0 或 XML1.1 文档节点树中定位节点。XPath 路径表达式是一种表达式语言,返回值可能是节点、节点集合、原子值或节点和原子值的混合等。XPath2.0 是 ...
在本项目“Xpath生成器,自动生成XPATH,C#版”中,开发者提供了一个工具,能够帮助用户快速生成适用于C#编程环境的XPath表达式。 XPath的工作原理是通过路径表达式来选取XML文档中的节点。路径表达式可以理解为...
**CSS选择器与XPath表达式** 在Web开发中,我们经常需要定位HTML或XML文档中的特定元素,以便进行样式设置、内容操作或者自动化测试。CSS选择器和XPath都是用于这一目的的强大工具。本文将深入探讨CSSSelector组件...
这款插件能够实时显示XPath表达式的匹配结果,使得开发者和数据分析师在处理复杂的网页结构时更加得心应手。 XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它通过路径表达式来选取XML文档中...
然而,编写绝对XPath表达式可能会变得复杂且容易出错,尤其是在动态页面和大型项目中。此时,`Relative XPath Helper`这个Chrome扩展程序就显得尤为实用。 该扩展程序的核心功能是提供元素之间的相对XPath表达式,...
XPath-Helper是一款针对XPath查询的高效工具,特别为谷歌浏览器设计,极大地简化了网页元素的选择和XPath表达式的构建过程。 在网页开发、自动化测试、数据抓取等领域,XPath-Helper扮演着至关重要的角色。通过安装...
这款插件能够帮助开发者和网页爬虫工程师快速编写和测试XPath表达式,提高工作效率。 XPath Helper的核心功能: 1. 实时预览:用户在输入XPath表达式后,插件会立即高亮显示匹配的页面元素,直观地呈现查询结果,...
它在版本2.0.2中提供了更稳定和高效的性能,使得开发者能够更便捷地利用XPath表达式来定位和提取所需的数据,尤其在网页抓取(爬虫)领域中发挥着重要作用。 XPath,全称XML Path Language,是一种在XML文档中查找...