`

XML::XML XLS之XPATH一

    博客分类:
  • XML
阅读更多

http://www.w3school.com.cn/xpath/xpath_axes.asp

XSL 指扩展样式表语言(EXtensible Stylesheet Language)。

万维网联盟 (W3C) 开始发展 XSL 的原因是:存在着对于基于 XML 的样式表语言的需求。

它起始于 XSL,结束于 XSLT、XPath 以及 XSL-FO。

XSL - 不仅仅是样式表语言

XSL 包括三部分:

XSLT
一种用于转换 XML 文档的语言。
XPath
一种用于在 XML 文档中导航的语言。
XSL-FO
一种用于格式化 XML 文档的语言。

什么是 XPath?

  • XPath 使用路径表达式在 XML 文档中进行导航
  • XPath 包含一个标准函数库
  • XPath 是 XSLT 中的主要元素
  • XPath 是一个 W3C 标准

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。

XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。

因此,对 XPath 的理解是很多高级 XML 应用的基础。

XPath 术语

节点(Node)

在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML 文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。

请看下面这个 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

</bookstore>

上面的XML文档中的节点例子:

<bookstore> (文档节点)
<author>J K. Rowling</author> (元素节点)
lang="en" (属性节点)

基本值(或称原子值,Atomic value)

基本值是无父或无子的节点。

基本值的例子:

J K. Rowling
"en"

项目(Item)

项目是基本值或者节点。

节点关系

父(Parent)

每个元素以及属性都有一个父。

在下面的例子中,book 元素是 title、author、year 以及 price 元素的父:

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

子(Children)

元素节点可有零个、一个或多个子。

在下面的例子中,title、author、year 以及 price 元素都是 book 元素的子:

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

同胞(Sibling)

拥有相同的父的节点

在下面的例子中,title、author、year 以及 price 元素都是同胞:

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

先辈(Ancestor)

某节点的父、父的父,等等。

在下面的例子中,title 元素的先辈是 book 元素和 bookstore 元素:

<bookstore>

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

</bookstore>

后代(Descendant)

某个节点的子,子的子,等等。

在下面的例子中,bookstore的后代是 book、title、author、year 以及 price 元素:

<bookstore>

<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

XPath 语法

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

XML 实例文档

我们将在下面的例子中使用这个 XML 文档。

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>

<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>

</bookstore>

选取节点

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

下面列出了最有用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
. 选取当前节点
.. 选取当前节点的父节点
@ 选取属性

实例

在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

路径表达式 结果
bookstore 选取 bookstore 元素的所有子节点
/bookstore

选取根元素 bookstore

注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!

bookstore/book 选取所有属于 bookstore 的子元素的 book 元素。
//book 选取所有 book 子元素,而不管它们在文档中的位置。
bookstore//book 选择所有属于 bookstore 元素的后代的 book 元素,而不管它们位于 bookstore 之下的什么位置。
//@lang 选取所有名为 lang 的属性。

谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点。

谓语被嵌在方括号中。

实例

在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

路径表达式 结果
/bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[position()<3] 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
//title[@lang] 选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang='eng'] 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。
/bookstore/book[price>35.00] 选取所有 bookstore 元素的 book 元素,且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]/title 选取所有 bookstore 元素中的 book 元素的 title 元素,且其中的 price 元素的值须大于 35.00。

选取未知节点

XPath 通配符可用来选取未知的 XML 元素。

通配符 描述
* 匹配任何元素节点
@* 匹配任何属性节点
node() 匹配任何类型的节点

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路径表达式 结果
/bookstore/* 选取 bookstore 元素的所有子节点
//* 选取文档中的所有元素
//title[@*] 选取所有带有属性的 title 元素。

选取若干路径

通过在路径表达式中使用“|”运算符,您可以选取若干个路径。

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路径表达式 结果
//book/title | //book/price 选取所有 book 元素的 title 和 price 元素。
//title | //price 选取所有文档中的 title 和 price 元素。
/bookstore/book/title | //price 选取所有属于 bookstore 元素的 book 元素的 title 元素,以及文档中所有的 price 元素。


</bookstore>

XPath Axes(坐标轴)

XML 实例文档

我们将在下面的例子中使用此 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>

<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>

</bookstore>

XPath 轴

轴可定义某个相对于当前节点的节点集。

轴名称 结果
ancestor 选取当前节点的所有先辈(父、祖父等)
ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身
attribute 选取当前节点的所有属性
child 选取当前节点的所有子元素。
descendant 选取当前节点的所有后代元素(子、孙等)。
descendant-or-self 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following 选取文档中当前节点的结束标签之后的所有节点。
namespace 选取当前节点的所有命名空间节点
parent 选取当前节点的父节点。
preceding 选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling 选取当前节点之前的所有同级节点。
self 选取当前节点。

位置路径表达式

位置路径可以是绝对的,也可以是相对的。

绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:

绝对位置路径:

/step/step/...

相对位置路径:

step/step/...

每个步均根据当前节点集之中的节点来进行计算。

步(step)包括:

轴(axis)
定义所选节点与当前节点之间的树关系
节点测试(node-test)
识别某个轴内部的节点
零个或者更多谓语(predicate)
更深入地提炼所选的节点集

步的语法:

轴名称::节点测试[谓语]

实例

例子 结果
child::book 选取所有属于当前节点的子元素的 book 节点
attribute::lang 选取当前节点的 lang 属性
child::* 选取当前节点的所有子元素
attribute::* 选取当前节点的所有属性
child::text() 选取当前节点的所有文本子节点
child::node() 选取当前节点的所有子节点
descendant::book 选取当前节点的所有 book 后代
ancestor::book 选择当前节点的所有 book 先辈
ancestor-or-self::book 选取当前节点的所有book先辈以及当前节点(假如此节点是book节点的话)
child::*/child::price

选取当前节点的所有 price 孙。

XPath 运算符

XPath 表达式可返回节点集、字符串、逻辑值以及数字。

XPath 运算符

下面列出了可用在 XPath 表达式中的运算符:

运算符 描述 实例 返回值
| 计算两个节点集 //book | //cd 返回所有带有 book 和 ck 元素的节点集
+ 加法 6 + 4 10
- 减法 6 - 4 2
* 乘法 6 * 4 24
div 除法 8 div 4 2
= 等于 price=9.80

如果 price 是9.80,则返回 true。

如果 price 是9.90,则返回 fasle。

!= 不等于 price!=9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.98,则返回 fasle。

< 小于 price<9.80

如果price是9.00,则返回true

如果price是9.98,则返回fasle

<= 小于或等于 price<=9.80

如果 price 是9.00,则返回 true。

如果 price 是9.90,则返回 fasle。

> 大于 price>9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.80,则返回 fasle。

>= 大于或等于 price>=9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.70,则返回 fasle。

or price=9.80 or price=9.70

如果 price 是 9.80,则返回 true。

如果 price 是 9.50,则返回 fasle。

and price>9.00 and price<9.90

如果 price 是 9.80,则返回 true。

如果 price 是 8.50,则返回 fasle。

mod 计算除法的余数 5 mod 2 1
分享到:
评论

相关推荐

    基于DOM4j和POI实现的XML文件转换为XLS(即标准EXCEL)的JAVA程序

    DOM4j支持SAX和DOM解析器,同时也提供了XPath查询支持,使得在XML文档中查找特定数据变得简单。 接下来,Apache POI是Apache软件基金会的一个开源项目,主要负责处理Microsoft Office文件格式,如XLS、XLSX、DOC和...

    将两个XML文件部分内容读出写入EXCEL

    在IT行业中,处理数据转换和整合是常见的任务之一。在这个案例中,我们将探讨如何使用Java的JDOM库解析XML文件,然后借助JXL库将提取的数据写入Excel工作表。以下是对这一技术实现的详细解释。 首先,让我们了解XML...

    解析Excel和XML

    1. **DOM解析**:如Python的xml.dom.minidom库,它构建了一个树形结构,允许遍历整个XML文档。 2. **SAX解析**:如Python的xml.sax模块,它只在遇到元素、属性等时触发事件,减少内存占用。 3. **XPath和XSLT**:...

    C#将List与xml互转_支持简单类型.rar

    这个压缩包"**C#将List与xml互转_支持简单类型.rar**"包含了一个示例文本文件"**C#将List与xml互转_支持简单类型.txt**"和一个可能用于测试的数据文件"**1.xls**"。 首先,让我们理解List和XML的基本概念。List是...

    xmlword.zip

    描述提到“DOMXPath快速解析xml代码”,表明其中至少有一个文件(可能是xml.php或xml1.php)涉及使用DOMDocument和XPath在PHP环境中解析XML文档。 在IT领域,XML(可扩展标记语言)是一种用于存储和传输数据的标准...

    xmlwordsearch.zip

    XPath(XML Path Language)是XML的一个重要查询语言,用于在XML文档中查找信息。它可以用来选取节点(如元素、属性、文本等)、评估表达式以及执行节点集的操作。DOMXPath是DOM API的一部分,用于在DOM树中执行...

    Excel2xml,excel文档解析

    接下来,我们介绍DOM4J,这是一个强大的Java XML处理库,提供了读写XML、XPath查询以及XML文档的操作等功能。当需要将Excel数据转换为XML时,DOM4J可以帮助我们构建XML文档的树形结构。下面是一个简单的例子,展示了...

    excel和xml解析需要引入的jar包

    - XMLBeans是一种基于XML Schema的Java绑定技术,它可以将XML文档转换为Java对象,并反之亦然。XMLBeans使用Java反射机制,提供了高性能的XML处理,适用于处理大型或复杂的XML数据。 4. Commons IO(commons-io-...

    XML数据标记语言查询参考手册

    XPath(XML Path Language)是用于在XML文档中定位信息的路径表达式语言,而XQuery则是一种更强大的查询语言,能够处理复杂的XML数据结构。这些查询技术使得从大型XML文档中提取特定信息变得容易。 SAX(Simple API...

    xml转换为LIST实例代码-XmlToList.rar

    压缩包中的"1.xls"文件可能是一个数据源,可能被用来生成XML,或者作为转换后的结果存储。在实际项目中,可能需要将Excel数据导入到XML,然后再用上述方法转换为List。 总的来说,这个实例代码展示了如何使用C#的...

    操作xml和excel文件

    1. **DOM4J+XPath对XML读取**:DOM4J是一个灵活的Java库,用于处理XML文档。它提供了强大的功能,包括读取、创建、修改和查询XML。XPath是一种在XML文档中查找信息的语言,允许我们根据节点路径快速定位到需要的数据...

    Asp.net 2.0 装载XML文件中数据到Excel文件中(示例代码下载)

    1. **读取XML文件**:使用`XmlDocument`或`XDocument`类可以方便地加载XML文件。例如,使用`XmlDocument`: ```csharp XmlDocument doc = new XmlDocument(); doc.Load("path_to_your_xml_file.xml"); ``` 如果...

    xml、excel、txt、property文件的解析

    Dom4j是一个流行的Java XML API,它提供了灵活而强大的XML处理功能。通过Dom4j,我们可以解析XML文档,获取元素、属性,甚至修改和构建新的XML结构。例如,你可以使用`DocumentFactory.createDocument()`创建新文档...

    delphi 下经典的数据导入控件,支持多个版本

    TQImport3XMLDoc Import data from generic XML files using XPath and DataLocation (tlAttributes, tlSubNodes) TQImport3XLSx Intended for importing the MS Excel 2007 sheets TQImport3Docx Import data from ...

    常用Python爬虫库汇总.docx

    * lxml:一个C语言编写的高效HTML/XML处理库,支持XPath。 * cssselect:一个解析DOM树和CSS选择器的库。 * pyquery:一个解析DOM树和jQuery选择器的库。 * BeautifulSoup:一个低效HTML/XML处理库,纯Python实现。 ...

    xlstestxlstestxlstest

    在实际应用中,XSLT经常与XPath(XML Path Language)结合使用,XPath是一种查询语言,用于在XML文档中查找信息。通过XPath表达式,XSLT可以定位到XML文档的任何部分。 如果`ssw`是压缩包内的一个文件,可能是XML...

    poi最新jar包下载

    6. xml-apis-1.0.b2.jar:这个库包含了XML相关的API接口,如DOM、SAX和XPath,是处理XML文档的基础组件。 7. commons-codec-1.5.jar:Apache Commons Codec库提供了各种编码和解码算法,如Base64和Hex,可能会在...

    poi-bin-3.7-20101029.zip

    1. `poi-3.7-20101029.jar`:这是Apache POI的核心库,提供了对HSSF(Horrible Spreadsheet Format)和XSSF(XML Spreadsheet Format)的支持,用于读写Excel的97-2003格式(.xls)和2007及以上版本的.xlsx格式。...

    php 导入导出Excel

    如果是XML格式,可以使用DOMDocument加载XML文件,通过XPath查询获取数据;如果是BIFF或OOXML格式,使用PHPExcel库加载文件,然后遍历工作表和单元格。 4. **导出Excel**: 导出Excel时,你需要构建一个Excel文件...

Global site tag (gtag.js) - Google Analytics