`

XML::XML XLS之XPATH一

    博客分类:
  • XML
阅读更多

http://www.w3school.com.cn/xpath/xpath_axes.asp

XSL 指扩展样式表语言(EXtensible Stylesheet Language)。

万维网联盟 (W3C) 开始发展 XSL 的原因是:存在着对于基于 XML 的样式表语言的需求。

它起始于 XSL,结束于 XSLT、XPath 以及 XSL-FO。

XSL - 不仅仅是样式表语言

XSL 包括三部分:

XSLT
一种用于转换 XML 文档的语言。
XPath
一种用于在 XML 文档中导航的语言。
XSL-FO
一种用于格式化 XML 文档的语言。

什么是 XPath?

  • XPath 使用路径表达式在 XML 文档中进行导航
  • XPath 包含一个标准函数库
  • XPath 是 XSLT 中的主要元素
  • XPath 是一个 W3C 标准

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。

XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。

因此,对 XPath 的理解是很多高级 XML 应用的基础。

XPath 术语

节点(Node)

在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML 文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。

请看下面这个 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

</bookstore>

上面的XML文档中的节点例子:

<bookstore> (文档节点)
<author>J K. Rowling</author> (元素节点)
lang="en" (属性节点)

基本值(或称原子值,Atomic value)

基本值是无父或无子的节点。

基本值的例子:

J K. Rowling
"en"

项目(Item)

项目是基本值或者节点。

节点关系

父(Parent)

每个元素以及属性都有一个父。

在下面的例子中,book 元素是 title、author、year 以及 price 元素的父:

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

子(Children)

元素节点可有零个、一个或多个子。

在下面的例子中,title、author、year 以及 price 元素都是 book 元素的子:

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

同胞(Sibling)

拥有相同的父的节点

在下面的例子中,title、author、year 以及 price 元素都是同胞:

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

先辈(Ancestor)

某节点的父、父的父,等等。

在下面的例子中,title 元素的先辈是 book 元素和 bookstore 元素:

<bookstore>

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

</bookstore>

后代(Descendant)

某个节点的子,子的子,等等。

在下面的例子中,bookstore的后代是 book、title、author、year 以及 price 元素:

<bookstore>

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

XPath 语法

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

XML 实例文档

我们将在下面的例子中使用这个 XML 文档。

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>

<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>

</bookstore>

选取节点

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

下面列出了最有用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
. 选取当前节点
.. 选取当前节点的父节点
@ 选取属性

实例

在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

路径表达式 结果
bookstore 选取 bookstore 元素的所有子节点
/bookstore

选取根元素 bookstore

注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!

bookstore/book 选取所有属于 bookstore 的子元素的 book 元素。
//book 选取所有 book 子元素,而不管它们在文档中的位置。
bookstore//book 选择所有属于 bookstore 元素的后代的 book 元素,而不管它们位于 bookstore 之下的什么位置。
//@lang 选取所有名为 lang 的属性。

谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点。

谓语被嵌在方括号中。

实例

在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

路径表达式 结果
/bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[position()<3] 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
//title[@lang] 选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang='eng'] 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。
/bookstore/book[price>35.00] 选取所有 bookstore 元素的 book 元素,且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]/title 选取所有 bookstore 元素中的 book 元素的 title 元素,且其中的 price 元素的值须大于 35.00。

选取未知节点

XPath 通配符可用来选取未知的 XML 元素。

通配符 描述
* 匹配任何元素节点
@* 匹配任何属性节点
node() 匹配任何类型的节点

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路径表达式 结果
/bookstore/* 选取 bookstore 元素的所有子节点
//* 选取文档中的所有元素
//title[@*] 选取所有带有属性的 title 元素。

选取若干路径

通过在路径表达式中使用“|”运算符,您可以选取若干个路径。

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路径表达式 结果
//book/title | //book/price 选取所有 book 元素的 title 和 price 元素。
//title | //price 选取所有文档中的 title 和 price 元素。
/bookstore/book/title | //price 选取所有属于 bookstore 元素的 book 元素的 title 元素,以及文档中所有的 price 元素。


</bookstore>

XPath Axes(坐标轴)

XML 实例文档

我们将在下面的例子中使用此 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>

<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>

</bookstore>

XPath 轴

轴可定义某个相对于当前节点的节点集。

轴名称 结果
ancestor 选取当前节点的所有先辈(父、祖父等)
ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身
attribute 选取当前节点的所有属性
child 选取当前节点的所有子元素。
descendant 选取当前节点的所有后代元素(子、孙等)。
descendant-or-self 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following 选取文档中当前节点的结束标签之后的所有节点。
namespace 选取当前节点的所有命名空间节点
parent 选取当前节点的父节点。
preceding 选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling 选取当前节点之前的所有同级节点。
self 选取当前节点。

位置路径表达式

位置路径可以是绝对的,也可以是相对的。

绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:

绝对位置路径:

/step/step/...

相对位置路径:

step/step/...

每个步均根据当前节点集之中的节点来进行计算。

步(step)包括:

轴(axis)
定义所选节点与当前节点之间的树关系
节点测试(node-test)
识别某个轴内部的节点
零个或者更多谓语(predicate)
更深入地提炼所选的节点集

步的语法:

轴名称::节点测试[谓语]

实例

例子 结果
child::book 选取所有属于当前节点的子元素的 book 节点
attribute::lang 选取当前节点的 lang 属性
child::* 选取当前节点的所有子元素
attribute::* 选取当前节点的所有属性
child::text() 选取当前节点的所有文本子节点
child::node() 选取当前节点的所有子节点
descendant::book 选取当前节点的所有 book 后代
ancestor::book 选择当前节点的所有 book 先辈
ancestor-or-self::book 选取当前节点的所有book先辈以及当前节点(假如此节点是book节点的话)
child::*/child::price

选取当前节点的所有 price 孙。

XPath 运算符

XPath 表达式可返回节点集、字符串、逻辑值以及数字。

XPath 运算符

下面列出了可用在 XPath 表达式中的运算符:

运算符 描述 实例 返回值
| 计算两个节点集 //book | //cd 返回所有带有 book 和 ck 元素的节点集
+ 加法 6 + 4 10
- 减法 6 - 4 2
* 乘法 6 * 4 24
div 除法 8 div 4 2
= 等于 price=9.80

如果 price 是9.80,则返回 true。

如果 price 是9.90,则返回 fasle。

!= 不等于 price!=9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.98,则返回 fasle。

< 小于 price<9.80

如果price是9.00,则返回true

如果price是9.98,则返回fasle

<= 小于或等于 price<=9.80

如果 price 是9.00,则返回 true。

如果 price 是9.90,则返回 fasle。

> 大于 price>9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.80,则返回 fasle。

>= 大于或等于 price>=9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.70,则返回 fasle。

or price=9.80 or price=9.70

如果 price 是 9.80,则返回 true。

如果 price 是 9.50,则返回 fasle。

and price>9.00 and price<9.90

如果 price 是 9.80,则返回 true。

如果 price 是 8.50,则返回 fasle。

mod 计算除法的余数 5 mod 2 1
分享到:
评论

相关推荐

    基于DOM4j和POI实现的XML文件转换为XLS(即标准EXCEL)的JAVA程序

    DOM4j支持SAX和DOM解析器,同时也提供了XPath查询支持,使得在XML文档中查找特定数据变得简单。 接下来,Apache POI是Apache软件基金会的一个开源项目,主要负责处理Microsoft Office文件格式,如XLS、XLSX、DOC和...

    将两个XML文件部分内容读出写入EXCEL

    在IT行业中,处理数据转换和整合是常见的任务之一。在这个案例中,我们将探讨如何使用Java的JDOM库解析XML文件,然后借助JXL库将提取的数据写入Excel工作表。以下是对这一技术实现的详细解释。 首先,让我们了解XML...

    解析Excel和XML

    1. **DOM解析**:如Python的xml.dom.minidom库,它构建了一个树形结构,允许遍历整个XML文档。 2. **SAX解析**:如Python的xml.sax模块,它只在遇到元素、属性等时触发事件,减少内存占用。 3. **XPath和XSLT**:...

    C#将List与xml互转_支持简单类型.rar

    这个压缩包"**C#将List与xml互转_支持简单类型.rar**"包含了一个示例文本文件"**C#将List与xml互转_支持简单类型.txt**"和一个可能用于测试的数据文件"**1.xls**"。 首先,让我们理解List和XML的基本概念。List是...

    xmlword.zip

    描述提到“DOMXPath快速解析xml代码”,表明其中至少有一个文件(可能是xml.php或xml1.php)涉及使用DOMDocument和XPath在PHP环境中解析XML文档。 在IT领域,XML(可扩展标记语言)是一种用于存储和传输数据的标准...

    xmlwordsearch.zip

    XPath(XML Path Language)是XML的一个重要查询语言,用于在XML文档中查找信息。它可以用来选取节点(如元素、属性、文本等)、评估表达式以及执行节点集的操作。DOMXPath是DOM API的一部分,用于在DOM树中执行...

    Excel2xml,excel文档解析

    接下来,我们介绍DOM4J,这是一个强大的Java XML处理库,提供了读写XML、XPath查询以及XML文档的操作等功能。当需要将Excel数据转换为XML时,DOM4J可以帮助我们构建XML文档的树形结构。下面是一个简单的例子,展示了...

    excel和xml解析需要引入的jar包

    - XMLBeans是一种基于XML Schema的Java绑定技术,它可以将XML文档转换为Java对象,并反之亦然。XMLBeans使用Java反射机制,提供了高性能的XML处理,适用于处理大型或复杂的XML数据。 4. Commons IO(commons-io-...

    XML数据标记语言查询参考手册

    XPath(XML Path Language)是用于在XML文档中定位信息的路径表达式语言,而XQuery则是一种更强大的查询语言,能够处理复杂的XML数据结构。这些查询技术使得从大型XML文档中提取特定信息变得容易。 SAX(Simple API...

    xml转换为LIST实例代码-XmlToList.rar

    压缩包中的"1.xls"文件可能是一个数据源,可能被用来生成XML,或者作为转换后的结果存储。在实际项目中,可能需要将Excel数据导入到XML,然后再用上述方法转换为List。 总的来说,这个实例代码展示了如何使用C#的...

    操作xml和excel文件

    1. **DOM4J+XPath对XML读取**:DOM4J是一个灵活的Java库,用于处理XML文档。它提供了强大的功能,包括读取、创建、修改和查询XML。XPath是一种在XML文档中查找信息的语言,允许我们根据节点路径快速定位到需要的数据...

    Asp.net 2.0 装载XML文件中数据到Excel文件中(示例代码下载)

    1. **读取XML文件**:使用`XmlDocument`或`XDocument`类可以方便地加载XML文件。例如,使用`XmlDocument`: ```csharp XmlDocument doc = new XmlDocument(); doc.Load("path_to_your_xml_file.xml"); ``` 如果...

    xml、excel、txt、property文件的解析

    Dom4j是一个流行的Java XML API,它提供了灵活而强大的XML处理功能。通过Dom4j,我们可以解析XML文档,获取元素、属性,甚至修改和构建新的XML结构。例如,你可以使用`DocumentFactory.createDocument()`创建新文档...

    delphi 下经典的数据导入控件,支持多个版本

    TQImport3XMLDoc Import data from generic XML files using XPath and DataLocation (tlAttributes, tlSubNodes) TQImport3XLSx Intended for importing the MS Excel 2007 sheets TQImport3Docx Import data from ...

    Advanced.Import.Component.Suite.v3.1.0.7

    TQImport3XMLDoc Import data from generic XML files using XPath and DataLocation (tlAttributes, tlSubNodes) TQImport3XLSx Intended for importing the MS Excel 2007 sheets TQImport3Docx Import data from ...

    常用Python爬虫库汇总.docx

    * lxml:一个C语言编写的高效HTML/XML处理库,支持XPath。 * cssselect:一个解析DOM树和CSS选择器的库。 * pyquery:一个解析DOM树和jQuery选择器的库。 * BeautifulSoup:一个低效HTML/XML处理库,纯Python实现。 ...

    xlstestxlstestxlstest

    在实际应用中,XSLT经常与XPath(XML Path Language)结合使用,XPath是一种查询语言,用于在XML文档中查找信息。通过XPath表达式,XSLT可以定位到XML文档的任何部分。 如果`ssw`是压缩包内的一个文件,可能是XML...

    poi最新jar包下载

    6. xml-apis-1.0.b2.jar:这个库包含了XML相关的API接口,如DOM、SAX和XPath,是处理XML文档的基础组件。 7. commons-codec-1.5.jar:Apache Commons Codec库提供了各种编码和解码算法,如Base64和Hex,可能会在...

    poi-bin-3.7-20101029.zip

    1. `poi-3.7-20101029.jar`:这是Apache POI的核心库,提供了对HSSF(Horrible Spreadsheet Format)和XSSF(XML Spreadsheet Format)的支持,用于读写Excel的97-2003格式(.xls)和2007及以上版本的.xlsx格式。...

Global site tag (gtag.js) - Google Analytics