用XPath精确定位节点元素
在利用XSL进行转换的过程中,匹配的概念非常重要。在模板声明语句 xsl:template match = ""和模板应用语句xsl:apply-templates select = "" 中,用引号括起来的部分必须能够精确地定位节点。具体的定位方法则在XPath中给出。
之所以要在XSL中引入XPath的概念,目的就是为了在匹配XML文档结构树时能够准确地找到某一个节点元素。可以把XPath比作文件管理路径:通过文件管理路径,可以按照一定的规则查找到所需要的文件;同样,依据XPath所制定的规则,也可以很方便地找到XML结构文档树中的任何一个节点,显然这对XSLT来说是一个最最基本的功能。
回页首
XPath数据类型
XPath可分为四种数据类型:
- 节点集(node-set)
节点集是通过路径匹配返回的符合条件的一组节点的集合。其它类型的数据不能转换为节点集。
- 布尔值(boolean)
由函数或布尔表达式返回的条件匹配值,与一般语言中的布尔值相同,有true和 false两个值。布尔值可以和数值类型、字符串类型相互转换。
- 字符串(string)
字符串即包含一系列字符的集合,XPath中提供了一系列的字符串函数。字符串可与数值类型、布尔值类型的数据相互转换。
- 数值(number)
在XPath中数值为浮点数,可以是双精度64位浮点数。另外包括一些数值的特殊描述,如非数值NaN(Not-a-Number)、正无穷大infinity、负无穷大-infinity、正负0等等。number的整数值可以通过函数取得,另外,数值也可以和布尔类型、字符串类型相互转换。
其中后三种数据类型与其它编程语言中相应的数据类型差不多,只是第一种数据类型是XML文档树的特有产物。
回页首
XPath节点类型
另外,由于XPath包含的是对文档结构树的一系列操作,因此搞清楚XPath节点类型也是很必要的。回忆一下第二章中讲到的XML文档的逻辑结构,一个XML文件可以包含元素、CDATA、注释、处理指令等逻辑要素,其中元素还可以包含属性,并可以利用属性来定义命名空间。相应地,在XPath中,将节点划分为七种节点类型:
- 根节点(Root Node)
根节点是一棵树的最上层,根节点是唯一的。树上其它所有元素节点都是它的子节点或后代节点。对根节点的处理机制与其它节点相同。在XSLT中对树的匹配总是先从根节点开始。
- 元素节点(Element Nodes)
元素节点对应于文档中的每一个元素,一个元素节点的子节点可以是元素节点、注释节点、处理指令节点和文本节点。可以为元素节点定义一个唯一的标识id。元素节点都可以有扩展名,它是由两部分组成的:一部分是命名空间URI,另一部分是本地的命名。
- 文本节点(Text Nodes)
文本节点包含了一组字符数据,即CDATA中包含的字符。任何一个文本节点都不会有紧邻的兄弟文本节点,而且文本节点没有扩展名。
- 属性节点(Attribute Nodes)
每一个元素节点有一个相关联的属性节点集合,元素是每个属性节点的父节点,但属性节点却不是其父元素的子节点。这就是说,通过查找元素的子节点可以匹配出元素的属性节点,但反过来不成立,只是单向的。再有,元素的属性节点没有共享性,也就是说不同的元素节点不共有同一个属性节点。
对缺省属性的处理等同于定义了的属性。如果一个属性是在DTD声明的,但声明为 #IMPLIED,而该属性没有在元素中定义,则该元素的属性节点集中不包含该属性。
此外,与属性相对应的属性节点都没有命名空间的声明。命名空间属性对应着另一种类型的节点。
- 命名空间节点(Namespace Nodes)
每一个元素节点都有一个相关的命名空间节点集。在XML文档中,命名空间是通过保留属性声明的,因此,在XPath中,该类节点与属性节点极为相似,它们与父元素之间的关系是单向的,并且不具有共享性。
- 处理指令节点(Processing Instruction Nodes)
处理指令节点对应于XML文档中的每一条处理指令。它也有扩展名,扩展名的本地命名指向处理对象,而命名空间部分为空。
- 注释节点(Comment Nodes)
注释节点对应于文档中的注释。
回页首
一个XML文档树
我们来构造一棵XML文档树,作为后面举例的依托:
<A id="a1">
<B id="b1">
<C id="c1">
<B name="b"/>
<D id="d1"/>
<E id="e1"/>
<E id="e2"/>
</C>
</B>
<B id="b2"/>
<C id="c2">
<B/>
<D id="d2"/>
<F/>
</C>
<E/>
</A>
|
以下将要介绍一些XPath中节点匹配的基本方法。
回页首
路径匹配
路径匹配与文件路径的表示相仿,比较好理解。有以下几个符号:
(1)用“/”指示节点路径
如“/A/C/D” 表示节点"A"的子节点"C"的子节点"D",即id值为d2的D节点, “/”表示根节点。
(2)用“//” 表示所有路径以"//"后指定的子路径结尾的元素
如“//E” 表示所有E元素,结果是所有三个E元素,如“//C/E”表示所有父节点为C的E元素,结果是id值为e1和e2的两个E元素 。
(3)用“*” 表示路径的通配符
如“/A/B/C/*”表示 A元素→B元素→C元素下的所有子元素,即name值为b的B元素、 id值为d1的D元素和id值为e1和e2的两个E元素
“/*/*/D”表示上面有两级节点的D元素,匹配结果是id值为d2的D元素 ,如“//*”表示所有的元素。
回页首
位置匹配
对于每一个元素,它的各个子元素是有序的。
如:/A/B/C[1]表示A元素→B元素→C元素的第一个子元素,得到name值为b的B元素
/A/B/C[last()]表示A元素→B元素→C元素的最后一个子元素,得到id值为e2的E元素
/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置号大于1的元素,得到id值为d1的D元素和两个具有id值的E元素
回页首
属性及属性值
在XPath中可以利用属性及属性值来匹配元素,要注意的是,元素的属性名前要有"@"前缀。例如:
//B[@id]表示所有具有属性id的B元素,结果为id值为b1和b2的两个B元素
//B[@*]表示所有具有属性的B元素,结果为两个具有id属性的B元素和一个具有name属性B元素
//B[not(@*)]表示所有不具有属性的B元素,结果为A元素→C元素下的B元素
//B[@id="b1"] id值为b1的B元素,结果为A元素下的B元素
回页首
亲属关系匹配
XML文档可归结为树型结构,因此任何一个节点都不是孤立的。通常我们把节点之间的归属关系归结为一种亲属关系,如父亲、孩子、祖先、后代、兄弟等等。在对元素进行匹配时,同样可以用到这些概念。例如:
//E/parent::* 表示所有E节点的父节点元素,结果为id值为a1的A元素和id值为c1的C元素
//F/ancestor::* 表示所有F元素的祖先节点元素,结果为id值为a1的A元素和id值为c2的C元素
/A/child::* 表示A的子元素,结果为id值为b1、b2的B元素,id值为c2的C元素,以及没有任何属性的E元素
/A/descendant::* 表示A的所有后代元素,结果为除A元素以外的所有其它元素
//F/self::* 表示所有F的自身元素,结果为F元素本身
//F/ancestor-or-self::* 表示所有F元素及它的祖先节点元素,结果为F元素、F元素的父节点C元素和A元素
/A/C/descendant-or-self::* 表示所有A元素→C元素及它们的后代元素,结果为id值为c2的C元素、该元素的子元素B、D、F元素
/A/C/following-sibling::* 表示A元素→C元素的紧邻的后序所有兄弟节点元素,结果为没有任何属性的E元素
/A/C/preceding-sibling::* 表示A元素→C元素的紧邻的前面所有兄弟节点元素,结果为id值为b1和b2的两个B元素
/A/B/C/following::* 表示A元素→B元素→C元素的后序的所有元素,结果为id 为b2的B元素、无属性的C元素、无属性的B元素、id为d2的D元素、无属性的F元素、\无属性的E元素。
/A/C/preceding::* 表示A元素→C元素的前面的所有元素,结果为id为b2的B元素、id为e2的E元素、id为e1的E元素、id为d1的D元素、name为 b的B元素、id为c1的C元素、id为b1的B元素
回页首
条件匹配
条件匹配就是利用一些函数的运算结果的布尔值来匹配符合条件的节点。常用于条件匹配的函数有四大类:节点函数、字符串函数、数值函数、布尔函数。例如last()、position()等等,这里我们就不再赘述。
以上这些匹配方法中,用得最多的还要数路径匹配。在上一章样式表的例子中,无论是在语句<xsl:template match="学生花名册">中,还是在语句 <xsl:value-of select="名字"/>中,都是依靠给出相对于当前路径的子路径来定位节点的。
<!-- CMA ID: 162352 --><!-- Site ID: 10 --><!-- XSLT stylesheet used to transform this file: dw-article-6.0-beta.xsl -->
分享到:
相关推荐
此外,XPath是XML的一个查询语言,用于选取XML文档中的节点,而XSLT(Extensible Stylesheet Language Transformations)则用于转换XML文档,实现数据的重组和格式化。 在实际应用中,XML常用于Web服务,如SOAP...
### XML快速入门教程知识点概述 #### 一、XML简介 - **定义与作用**:可扩展标记语言(Extensible Markup Language,简称XML)是一种用于标记数据的语言,它被设计用来传输和存储数据。XML的数据是自描述性的,这...
- **便于与XML技术集成**:XHTML本身就是基于XML的,因此可以更容易地与XSLT、XPath等XML技术结合使用。 以上就是对《无废话XML》这本书中部分章节内容所涉及的关键知识点的总结。这些内容涵盖了XML的基础知识、...
第三章和第四章可能会介绍XPath和XSLT,用于查询和转换XML文档;第五章至第八章可能涵盖JSP与XML的结合,包括DOM和SAX解析器的使用,以及如何在JSP中处理XML数据;第九章和实验指导则可能涉及AJAX的应用,包括...
在"网站建设——XML教程CHM"中,可能涵盖了以下内容: 1. XML基础:解释XML的基本结构、语法和命名规则,包括元素、属性、实体、注释等概念。 2. DTD和XML Schema:介绍如何使用这两种验证工具来定义XML文档的结构...
- **XPath**:一种在XML文档中查找信息的语言,用于选取节点或节点集。 - **XSLT(Extensible Stylesheet Language Transformations)**:用于转换XML文档的样式表语言,可以将XML转换成HTML或其他格式。 - **SOAP...
Delphi 中使用 SQL Server 的 XML 特性 —— 查询技术 Delphi 自从第一版开始就支持使用 BDE(Borland Database Engine)来连接数据库,直到后来的 Delphi 5/6 中使用 ADO(ActiveX Data Objects)来实现基于OLE ...
XML的设计目标是传输和存储数据,而不是显示数据,这与HTML(超文本标记语言)的主要目标——展示内容有所不同。本教程“实战XML教程(第二版)”深入浅出地探讨了XML的各种核心概念和技术,旨在帮助读者掌握XML的全面...
2. XPath和Xslt:XPath是一种查询XML数据的语言,用于选取XML文档中的节点。C#提供了XPathDocument和XmlNamespaceManager等类来支持XPath查询。Xslt(Extensible Stylesheet Language Transformations)用于将XML...
8. **XPath和XSLT**:XPath是一种查询XML文档的语言,用来选取节点或节点集。XSLT(Extensible Stylesheet Language Transformations)则用于转换XML文档,通过样式表将XML数据转化为HTML、PDF或其他格式。 9. **...
本教程将深入探讨C#编程人员如何掌握XML的基本概念和实用技巧。 首先,理解XML的基础是至关重要的。XML是一种结构化的数据表示方式,它使用标签来定义数据的结构和意义。与HTML不同,XML的设计目标是传输和存储数据...
xml入门小项目——通讯录系统 系统特点: 1、系统主程序入口MainProgram.java 2、实现通讯录中联系人的增删改查功能,联系人数据保存在xml文档中。系统xml文档通过dom4j技术创建和解析。 3、涉及JavaSE中的集合、...
尽管TinyXML简单易用,但它并不支持XML的全部特性和标准,例如命名空间、DTD(文档类型定义)和XPath查询。如果你的项目需要处理更复杂的XML特性,可能需要考虑使用如pugixml、Xerces-C++或Qt的QXmlStreamReader等更...
9. **XPath**:XPath是一种在XML文档中查找信息的语言,它可以选取节点、计算表达式以及执行导航。 10. **XSLT**:XSLT(Extensible Stylesheet Language Transformations)用于转换XML文档,它可以根据XML文档的...
Python 爬虫是指使用 Python 语言来进行网络爬虫的操作,而 XPath 则是 XML 文档中搜索内容的一门语言。由于 HTML 是 XML 的一个子集,因此 XPath 也可以用于解析 HTML 文档。 在 Python 中,使用 XPath 需要先导入...
在《XML Schema》章节中,我们会接触到更现代、更强大的XML文档验证工具——XML Schema。XML Schema提供了更丰富的数据类型和更复杂的结构约束,它比DTD更加灵活,更适合复杂业务场景的需求。 然后,进入《XPath》...
本文将深入探讨JDOM库中XPath的相关方法——`selectNodes()`和`selectSingleNode()`,以及它们的用法。 首先,我们来理解JDOM的基本概念。JDOM是Java Document Object Model的缩写,它提供了一种基于Java的API来...
- 学习如何使用XElement和XAttribute类创建XML结构,以及XPath和XQuery的替代方法。 3. **ASP.NET中的XML处理** - Web.config配置文件:学习如何使用XML存储和管理ASP.NET应用程序的配置信息。 - XML数据绑定:...
XML的设计目标是传输和存储数据,而非显示数据,这与HTML(超文本标记语言)的主要功能——呈现数据形成鲜明对比。XML的结构化特性使其在处理复杂的数据集成和跨平台通信时具有极高的灵活性。 XML的基本构成单元是...