`
fantaxy025025
  • 浏览: 1317523 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类

XPath入门

阅读更多

From:http://www.webjx.com/xml/xmlxslt-9905.html

 

XPath是一种用来从文档树中选择节点和节点集的语言。从XPath的角度来看,共有七种节点:

  • 根节点

  • 元素节点

  • 属性节点

  • 文本节点

  • 注释节点

  • 处理指令节点

  • 名称空间节点

CDATA部份,实体引用和文档类型声明不包括在内,XPath在所有这些项都并入文档之后才起作用。根节点和根元素是不同的两个概念,根节点包含整篇文档,包括根元素。

本文由网页教学网(http://www.webjx.com )整理发布!转载请注明出处,谢谢!

1. 匹配模式

匹配模板的通用模式

Table 6.1. 

模式 描述
match="E" 匹配元素E
match="*" 匹配任意元素
match="E|F" 匹配元素E和F
match="E/F" 匹配以E为父元素的元素F
match="E//F" 匹配以E为根元素的元素F
match="/" 匹配根节点
match="text()" 匹配文本节点
match="comment()" 匹配注释节点
match="processing-instruction()" 匹配处理指令
match="node()" 匹配除属性节点和根节点外的节点
match="id(test)" 匹配具有唯一ID test的元素
match="E[@CLASS="foo"] 匹配元素E,其类属性为foo
match="E[F]" 匹配元素包含有F元素的E元素

2. XPath轴

XPath提供了选择节点的机制,两个较有用的是轴选择和谓语选择,轴指定上下文节点和要选择的节点的关系。共有十三种轴,最常用的有四种,分别是子轴(child)、属性轴(attribute)、自已(self)、双亲(parent)。

Table 6.2. XPath轴描述

轴 描述
child 包含当前节点的儿子
descendent 包含当前节点的后代,后代不包含属性(attribute)或名称域(namespace)节点
parent 包含当前节点的父亲
ancestor 包含当前节点的祖先,祖先总是包含根节点
following-sibling 包含当前节点随后的所有节点树,但不包含attribute或namespace节点
preceding-sibling 包含当前节点之前的所有节点树,但不包含attribute或namespace节点
following 包含当前节点随后的所有节点,following轴排除了当前节点的后代和attribute或namespace节点
preceding 包含当前节点之前的所有节点,following轴排除了当前节点的后代和attribute或namespace节点
attribute 包含当前节点的所有属性
namespace 包含当前节点的所有namespace节点
self 只包含当前节点
descendent-or-self 包含当前节点和当前节点的后代
ancestor-or-self 包含当前节点和当前节点的祖先

3. 谓词

XPath表达式可以匹配多个节点,如需对匹配的节点进行进一步的筛选,可以使用谓词。

Table 6.3. 选择节点常用谓词

谓词 描述
select="E" 选择是当前节点的孩子的E元素
select="" 选择当前节点的孩子的所有元素
select="text()" 选择当前节点的文本节点孩子
select="@name" 选择当前节点的name属性
select="@*" 选择当前节点的所有属性
select="E[1]" 选择当前节点的孩子的第一个E元素
select="E[last()]" 选择当前节点的孩子的最后一个E元素
select="*/E" 选择当前节点的孙了的所有E元素
select="E//F" 选择从当前节点的孩子的E元素派生而来的元素F
select="//" 选择根元素
select="//E" 选择从根节点派生而来的E元素
select="//E/F" 选择所有是从根节点派生而来的E元素的孩子的F元素
select="." 选择当前节点
select=".//E" 选择从当前节点派生而来的所有E元素
select=".." 选择当前节点的父节点
select="../@name" 选择当前节点的父节点的name属性
select="E[@name='foo']" 选择所有是当前节点的孩子,并且其name属性具有foo值的E属性,除等号外,还可用<,>,<=,>=和!=
select="E[@foo and @bar]" 选择所有包含foo和bar属性的E元素

home/person/@id这种定位路径的写法叫简写定位路径,该写法简洁,容易理解,是XSLT匹配模式中最常用的写法。还有一种称为非简写 定位路径的写法,它把节点测试和轴结合在一起,如child::home/child::person/attribute::id。该写法在实际使用中 不常用,但它具有非常重要的性能因此有必要了解。

4. XPath表达式

位置路径是XPath的一个最常用的表达式,用以标识XML文档的节点集。除此之上,XPath表达式还可返回数字、布尔和字符串。非节点集的 XPath表达式不能用于xsl:template元素的match属性中。它们用于xsl:value-of元素的select属性值或用于位置路径的 谓词中。

本文由网页教学网(http://www.webjx.com )整理发布!转载请注明出处,谢谢!

每个XPath位置路径可分为一步名多步,每步以“/”号分隔,如:

room[\@name=$root]/date[year=$year and month=$month]/meeting

上下文节点即当前正在处理的节点,也就是位置路径定位的当前节点。上下文在XPath表达式计算前被创建,由XSLT处理器创建。处理每一步后,上下文都会改变。

位置路径中的步可分为三部份:轴(axis)、节点测试(note test)和谓词(predicate),它的写法如下:

axis::note-test[predicate]

轴和节点测试之间用“::”分开,每个谓词由括号[]括起来。

要设计好一个位置路径,需确保在每一步选择最少的节点,使用最严格的轴,用最严格的节点测试。避免使用谓词,因为由轴和节点测试选择的节点集的每个节点都会用作谓词的上下文节点。对于位置路径的三步,最节省的是节点测试。

XPath中的所有数字都是8个字节的IEEE754浮点双精度类型,与java的double类型相同。可表示正无穷大、负无穷大和NaN(零除零)值。支持五种运算符,分别是加(+)、减(-)、乘(*)、除(div)、取余(mod)。

XPath中的字符串是Unicode字符,用单引号或双引号定界。可以使用=和!=对字符进行比较,也可用<,>,<=,>关系运算符,但比较的两个字符必须是数字,否则比较结果没有意义。

XPath中的布尔值常用于位置路径的谓词中,如/person[name="debian"]。布尔值还常用于xsl:if和xsl:when元素的test属性中。如:

<xsl:template match="home">
   <xsl:if test = ".='debian' or .='redhat'">
      <xsl:value-of select = "." />
   </xsl:if>
</xsl:template>

5. XPath函数

XPath还提供很多函数,用于表达式和谓词。XPath函数的返回值有四种类型,分别是:

  • 布尔值,如:true()返回ture(真),false()返回false(假),not()对布尔值取反。

  • 数字,如:number()把任意类型转化数字,celing()返回大于或等于参数的最小整数。

  • 节点集,如:position()返回当有节点在上下节点列表中的位置,count()可统计节点数。

  • 字符串,如:string()转化任意类型为字符串,string-length()返回字符串长度。

分享到:
评论

相关推荐

    xpath入门教程整理

    xpath入门教程整理、值得下载、不差这一分、xpath解析xml结构非常牛。

    《XSLT与XPath入门:转换XML文档与数据》 [PDF]

    XML内容管理应用程序的...本入门教程提供了XSLT处理模型的基础,为开发者提供了重要的基本功. XSLT 是一种用于将 XML 文档转换为 XHTML 文档或其他 XML 文档的语言。  XPath 是一种用于在 XML 文档中进行导航的语言。

    python爬虫之xpath入门(csdn)————程序.pdf

    Python 爬虫之 XPath 入门 Python 爬虫是指使用 Python 语言来进行网络爬虫的操作,而 XPath 则是 XML 文档中搜索内容的一门语言。由于 HTML 是 XML 的一个子集,因此 XPath 也可以用于解析 HTML 文档。 在 Python...

    xslt与xpath入门转换xml文档与数据

    在处理XML文档时,XSLT(eXtensible Stylesheet Language Transformations)和XPath(XML Path Language)是两个重要的工具。 XSLT是用于转换XML文档的样式表语言,它的主要功能是将XML源文档转换成另一种XML格式,...

    XPath入门教程中文WORD版最新版本

    本文档主要讲述的是XPath入门教程;在本教程中,您将通过编写拍卖站点应用程序的表示层来学习XPath。您将在XSLT样式表内部指定XPath表达式,该样式表用于展示包含拍卖物品的XML文档。希望本文档会给有需要的朋友带来...

    XSLT与XPath入门转换XML文档与数据

    ### XSLT与XPath入门:转换XML文档与数据 #### 一、XSLT与XPath基础知识 **XSLT(Extensible Stylesheet Language Transformations)**是一种基于XML的标准语言,用于将一个XML文档转换成另一种XML文档或者HTML...

    第03章_Xpath 入门.zip

    Xpath

    XPATH学习,xpath入门的好东西啊

    ### XPATH基础与实战应用详解 #### 一、XPATH简介 XPATH是一种用于XML文档查询的语言,它能够帮助我们快速地在XML文档中查找信息。XPATH支持使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式非常...

    互联网金融爬虫怎么写-第一课 p2p网贷爬虫(XPath入门)

    本系列教程的目的是帮助开发者掌握如何使用爬虫技术,特别是XPath语言,来爬取互联网金融相关网站的数据,尤其是P2P网贷平台的理财产品信息。 在开始编写爬虫之前,需要准备一些基础工具和知识。首先,推荐使用神箭...

    XPath入门 - XSL教程 - 3

    ### XPath入门 - XSL教程详解 #### 一、XPath简介 XPath是一种强大的查询语言,用于在XML文档中查找信息。其主要目标是对XML文档的组件进行定位,同时也为字符串、数字和布尔值的操作提供了基本的功能。XPath使用...

    XPath从入门到精通

    XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点,如元素、属性、文本等。XPath通过路径表达式来选取XML文档中的节点,这些路径表达式类似于文件系统中的文件路径...

    使用 XML XPath 2.0 入门

    虽然还是候选推荐标准,但 XPath 2.0 即将得到正式批准。这是 1999 年以来对 XPath 推荐标准的第一次修订,市场对此抱有很大期望,事实上一些工具已经开始实现最新的草案。这些修改是根本性的,我预料到时候人们也许...

    mybatis入门之xpath解析xml

    因此,无论是XML解析还是MyBatis的使用,XPath都是一个不可或缺的知识点,对于初学者来说,掌握XPath的入门知识是迈入这个领域的第一步。通过实际的练习和项目实践,可以进一步提升对XPath和MyBatis的运用能力。

    xpath学习笔记 比较入门大家共享

    XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它被广泛应用于XML处理,如XSLT、XQuery以及XPointer等标准中。XPath通过路径表达式来选取XML文档中的元素、属性或其他类型的节点,使得我们可以...

    XML入门教程:XPath-XML/XSLT

    【XPath】是XML文档处理中的重要工具,全称为XML Path Language。它被设计用来选取XML文档中的特定节点,包括根节点、元素节点、属性节点、文本节点、注释节点、处理指令节点以及名称空间节点。XPath通过路径表达式...

    阿里妈妈高佣金采集器.pdf

    学习XPath是进行网页数据采集的关键,可以通过提供的教程如“八爪鱼7.0教程——AJAX点击和翻页教程”、“八爪鱼7.0教程——AJAX滚动教程”以及XPath入门教程来提升技能。 在实际操作中,需要注意根据网站的实际加载...

    xml+Xpath基本应用

    xml+Xpath基本应用,含有Dom4J及支持Xpath所需要的jar包,及xpath的入门教程,并附带一份源代码,提供对xml文件的基本读写及内容的增删改查的操作,方便学习xml,xpath及dom4j

    XPath语法规

    在描述中提到的"XSLT入门",XSLT是Extensible Stylesheet Language Transformations的缩写,是一种转换XML文档的语言。XSLT使用XPath来定位源XML中的节点,并定义如何将这些节点转换成新的XML结构或者HTML、文本等...

Global site tag (gtag.js) - Google Analytics