`
zyjwy02
  • 浏览: 142472 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

XPath最通俗的教程(收藏)

 
阅读更多

基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径

/AAA

选择根元素AAA


     <
AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <CCC/>
     </
AAA>

 

/AAA/CCC

选择AAA的所有CCC子元素


     <AAA>
          <BBB/>
          <
CCC/>
          <BBB/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <
CCC/>
     </AAA>

 

/AAA/DDD/BBB

选择AAA的子元素DDD的所有子元素


     <AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <BBB/>
          <DDD>
               <
BBB/>
          </DDD>
          <CCC/>
     </AAA>

 

 

实例 2

如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)

 

//BBB

选择所有BBB元素


     <AAA>
          <
BBB/>
          <CCC/>
          <
BBB/>
          <DDD>
               <
BBB/>
          </DDD>
          <CCC>
               <DDD>
                    <
BBB/>
                    <
BBB/>
               </DDD>
          </CCC>
     </AAA>

 

//DDD/BBB

选择所有父元素是DDDBBB元素


     <AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <DDD>
               <
BBB/>
          </DDD>
          <CCC>
               <DDD>
                    <
BBB/>
                    <
BBB/>
               </DDD>
          </CCC>
     </AAA>

 

 

实例 3

星号 * 表示选择所有由星号之前的路径所定位的元素

 

/AAA/CCC/DDD/*

选择所有路径依附于/AAA/CCC/DDD的元素


     <AAA>
          <XXX>
               <DDD>
                    <BBB/>
                    <BBB/>
                    <EEE/>
                    <FFF/>
               </DDD>
          </XXX>
          <CCC>
               <DDD>
                    <
BBB/>
                    <
BBB/>
                    <
EEE/>
                    <
FFF/>
               </DDD>
          </CCC>
          <CCC>
               <BBB>
                    <BBB>
                         <BBB/>
                    </BBB>
               </BBB>
          </CCC>
     </AAA>

 

/*/*/*/BBB

选择所有的有3个祖先元素的BBB元素


     <AAA>
          <XXX>
               <DDD>
                    <
BBB/>
                    <
BBB/>
                    <EEE/>
                    <FFF/>
               </DDD>
          </XXX>
          <CCC>
               <DDD>
                    <
BBB/>
                    <
BBB/>
                    <EEE/>
                    <FFF/>
               </DDD>
          </CCC>
          <CCC>
               <BBB>
                    <
BBB>
                         <BBB/>
                    </
BBB>
               </BBB>
          </CCC>
     </AAA>

 

//*

选择所有元素


     <
AAA>
          <
XXX>
               <
DDD>
                    <
BBB/>
                    <
BBB/>
                    <
EEE/>
                    <
FFF/>
               </
DDD>
          </
XXX>
          <
CCC>
               <
DDD>
                    <
BBB/>
                    <
BBB/>
                    <
EEE/>
                    <
FFF/>
               </
DDD>
          </
CCC>
          <
CCC>
               <
BBB>
                    <
BBB>
                         <
BBB/>
                    </
BBB>
               </
BBB>
          </
CCC>
     </
AAA>

 

 

 

实例 4

方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, last()函数则表示选择集中的最后一个元素.

 

/AAA/BBB[1]

选择AAA的第一个BBB子元素


     <AAA>
          <
BBB/>
          <BBB/>
          <BBB/>
          <BBB/>
     </AAA>

 

/AAA/BBB[last()]

选择AAA的最后一个BBB子元素


     <AAA>
          <BBB/>
          <BBB/>
          <BBB/>
          <
BBB/>
     </AAA>

 

 

 

实例 5

//@id

选择所有的id属性


     <AAA>
          <BBB
id = "b1"/>
          <BBB
id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>

 

//BBB[@id]

选择有id属性的BBB元素


     <AAA>
          <
BBB id = "b1"/>
          <
BBB id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>

 

//BBB[@name]

选择有name属性的BBB元素


     <AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <
BBB name = "bbb"/>
          <BBB/>
     </AAA>

 

//BBB[@*]

选择有任意属性的BBB元素


     <AAA>
          <
BBB id = "b1"/>
          <
BBB id = "b2"/>
          <
BBB name = "bbb"/>
          <BBB/>
     </AAA>

 

//BBB[not(@*)]

选择没有属性的BBB元素


     <AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <BBB name = "bbb"/>
          <
BBB/>
     </AAA>

 

 

 

实例 6

属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格

 

//BBB[@id='b1']

选择含有属性id且其值为'b1'BBB元素


     <AAA>
          <
BBB id = "b1"/>
          <BBB name = " bbb "/>
          <BBB name = "bbb"/>
     </AAA>

 

//BBB[@name='bbb']

选择含有属性name且其值为'bbb'BBB元素


     <AAA>
          <BBB id = "b1"/>
          <BBB name = " bbb "/>
          <
BBB name = "bbb"/>
     </AAA>

 

//BBB[normalize-space(@name)='bbb']

选择含有属性name且其值(在用normalize-space函数去掉前后空格后)'bbb'BBB元素


     <AAA>
          <BBB id = "b1"/>
          <
BBB name = " bbb "/>
          <
BBB name = "bbb"/>
     </AAA>

 

 

 

实例 7

count()函数可以计数所选元素的个数

 

//*[count(BBB)=2]

选择含有2BBB子元素的元素


     <AAA>
          <CCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </CCC>
          <
DDD>
               <BBB/>
               <BBB/>
          </
DDD>
          <EEE>
               <CCC/>
               <DDD/>
          </EEE>
     </AAA>

 

//*[count(*)=2]

选择含有2个子元素的元素


     <AAA>
          <CCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </CCC>
          <
DDD>
               <BBB/>
               <BBB/>
          </
DDD>
          <
EEE>
               <CCC/>
               <DDD/>
          </
EEE>
     </AAA>

 

//*[count(*)=3]

选择含有3个子元素的元素


     <
AAA>
          <
CCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </
CCC>
          <DDD>
               <BBB/>
               <BBB/>
          </DDD>
          <EEE>
               <CCC/>
               <DDD/>
          </EEE>
     </
AAA>

 

 

 

实例 8

name()函数返回元素的名称, start-with()函数在该函数的第一个参数字符串是以第二个参数字符开始的情况返回true, contains()函数当其第一个字符串参数包含有第二个字符串参数时返回true.

 

//*[name()='BBB']

选择所有名称为BBB的元素(这里等价于//BBB)


     <AAA>
          <BCC>
               <
BBB/>
               <
BBB/>
               <
BBB/>
          </BCC>
          <DDB>
               <
BBB/>
               <
BBB/>
          </DDB>
          <BEC>
               <CCC/>
               <DBD/>
          </BEC>
     </AAA>

 

//*[starts-with(name(),'B')]

选择所有名称以"B"起始的元素


     <AAA>
          <
BCC>
               <
BBB/>
               <
BBB/>
               <
BBB/>
          </
BCC>
          <DDB>
               <
BBB/>
               <
BBB/>
          </DDB>
          <
BEC>
               <CCC/>
               <DBD/>
          </
BEC>
     </AAA>

 

//*[contains(name(),'C')]

选择所有名称包含"C"的元素


     <AAA>
          <
BCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </
BCC>
          <DDB>
               <BBB/>
               <BBB/>
          </DDB>
          <
BEC>
               <
CCC/>
               <DBD/>
          </
BEC>
     </AAA>

 

 

 

实例 10

多个路径可以用分隔符 | 合并在一起

 

//CCC | //BBB

选择所有的CCCBBB元素


     <AAA>
          <
BBB/>
          <
CCC/>
          <DDD>
               <
CCC/>
          </DDD>
          <EEE/>
     </AAA>

 

/AAA/EEE | //BBB

选择所有的BBB元素和所有是AAA的子元素的EEE元素


     <AAA>
          <
BBB/>
          <CCC/>
          <DDD>
               <CCC/>
          </DDD>
          <
EEE/>
     </AAA>

 

/AAA/EEE | //DDD/CCC | /AAA | //BBB

可以合并的路径数目没有限制


     <
AAA>
          <
BBB/>
          <CCC/>
          <DDD>
               <
CCC/>
          </DDD>
          <
EEE/>
     </
AAA>

 

 

 

实例 11

child(axis)包含上下文节点的子元素, 作为默认的轴,可以忽略不写.

 

/AAA

等价于 /child::AAA


     <
AAA>
          <BBB/>
          <CCC/>
     </
AAA>

 

/child::AAA

等价于/AAA


     <
AAA>
          <BBB/>
          <CCC/>
     </
AAA>

 

/AAA/BBB

等价于/child::AAA/child::BBB


     <AAA>
          <
BBB/>
          <CCC/>
     </AAA>

 

/child::AAA/child::BBB

等价于/AAA/BBB


     <AAA>
          <
BBB/>
          <CCC/>
     </AAA>

 

/child::AAA/BBB

二者都可以被合并


     <AAA>
          <
BBB/>
          <CCC/>
     </AAA>

 

 

 

 

实例 12

descendant (后代)轴包含上下文节点的后代,一个后代是指子节点或者子节点的子节点等等, 因此descendant轴不会包含属性和命名空间节点.

 

/descendant::*

选择文档根元素的所有后代.即所有的元素被选择


     <
AAA>
          <
BBB>
               <
DDD>
                    <
CCC>
                         <
DDD/>
                         <
EEE/>
                    </
CCC>
               </
DDD>
          </
BBB>
          <
CCC>
               <
DDD

分享到:
评论

相关推荐

    xpath文件

    在当今信息化时代,XML作为一种常用的数据交换格式,广泛应用于各种网络平台和数据交换中。...这些资源的整合,为用户构建了一个从理论到实践的完整XPath学习和应用环境,是值得每一个XML处理者收藏的宝贵资料。

    XPath快速上手手册.mht

    在博客园收藏的一个网页, 说实话不能算是手册,但做为一个入门教程,写得非常通俗。

    开发人员一定要加入收藏夹的网站收藏

    5. **itpub.net** - 国内最专业的综合性技术社区,讨论范围广泛,包括但不限于数据库、云计算、大数据等领域。 6. **netvtm.com** - 主要翻译自w3schools.com,提供中文版的编程学习资料。 7. **regexlib.com** - ...

    开发人员一定要加入收藏夹的网站

    本文将详细介绍一系列被公认为开发人员应当加入收藏夹的重要网站,这些网站覆盖了从编程语言、框架、设计模式到开源项目等多个领域,是开发人员提升自我、解决问题的绝佳助手。 ### HTML、CSS、XPath、XSL、...

    开发人员一定要加入收藏夹的网站 推荐

    5. **ITPub.net** - 作为国内最专业的综合性技术社区之一,ITPub提供了丰富的技术讨论和资源共享,是开发者交流经验和技术的好去处。 6. **NetVTM.com** - 该网站主要翻译自w3schools.com的内容,虽然原创内容不多...

    网站需要的api合集

    DOM4J文档会详细解释如何解析XML文档、创建新的XML结构,以及执行XPath查询;HTMLHelp文档会指导如何构建帮助系统,包括CHM文件的生成;而W3School的教程则提供了丰富的实践练习,帮助读者巩固理论知识。 在网页...

    从Xml中读取信息

    本教程将深入探讨如何从Xml文件中提取信息,特别是以手机收藏信息为例进行练习,帮助你掌握基本的Xml格式和读取方法。 1. **Xml基本概念** - **Xml语法**: Xml文档由元素(Element)、属性(Attribute)、文本内容...

Global site tag (gtag.js) - Google Analytics