XPath语言是使用路径表达式确定XML文档结点. 所有的XML元素必须合理包含,且所有的XML文档必须有一个根元素。如同HTML一样,XML元素同样也可以拥有属性。XML元素的属性以名字/值成对的出现。XML语法规范要求XML元素属性值必须用引号引着。
<?xml version="1.0" encoding="GB2312"?>
<instance>
<data>
<helloworld hw="4711">Hello World</helloworld>
<repeatdata>
<input>aaa</input>
<input>bbb</input>
<input>ccc</input>
</repeatdata>
<extra>Got it!</extra>
<message>Hello !</message>
<titletext>These are examples of XForms Action usage.</titletext>
</data>
</instance>
在这里以这个简单XML文档,来学习XPath语言.
1.节点定位:
XML文挡可以表示为树结构节点形式
XPath使用模式表达式识别XML文档的节点。
一个XPath的模式是使用反斜杠“/”分开子元素名称描述路径
下面的XPath表达式选择元素instance下元素data中的helloworld元素
/instance/data/helloworld
注释:用“/”路径开始代表元素的绝对路径.
不用“/”路径开始代表元素的相对路径
data/helloworld
用“//”路径开始代表整个文档满足条件的所有元素
下面的XPath表达式选择文档中所有的input元素
//input
2.选择未知元素
通配符 “*”可用于选择未知XML元素
下面的XPath表达式选择元素instance中的所有data元素所属的子元素
/instance/data/*
下面的XPath表达式选择元素data下所有孙子辈的input元素
/instance/data/*/input
下面的XPath表达式选择所有具有三个祖先的input元素
/*/*/*/input
下面的XPath表达式选择文档所有元素
//*
3.选择属性
在XPath中,所有属性使用@前缀
下面的XPath表达式,选取名为hw的属性
//@hw
下面的XPath表达式,选取具有hw属性的元素
//data[@hw]
下面的XPath表达式,选取所有具有任何属性的data元素
//data[@*]
下面的XPath表达式,选取具有hw等于"parts"属性的data元素
//data[@hw="4711"]
以上XPath语言是初级的XPath语言,还有很多高级应用.其实我们学任何一门语言都一样,把基础打好,高级部分都是自己后天的努力.
分享到:
相关推荐
XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点,如元素、属性、文本等。XPath通过路径表达式来选取XML文档中的节点,这些路径表达式类似于文件系统中的文件路径...
虽然还是候选推荐标准,但 XPath 2.0 即将得到正式批准。这是 1999 年以来对 XPath 推荐标准的第一次修订,市场对此抱有很大期望,事实...这两种语言都以 XPath 作为核心查询引擎,并增加了一些语句来格式化查询结果。
XML内容管理应用程序的增长刺激了对XSLT和Xpath技能的要求.本入门教程提供了XSLT处理模型的基础,为开发者提供了重要的基本功. XSLT 是一种用于将 XML 文档转换为 ... XPath 是一种用于在 XML 文档中进行导航的语言。
Python 爬虫之 XPath 入门 Python 爬虫是指使用 Python 语言来进行网络爬虫的操作,而 XPath 则是 XML 文档中搜索内容的一门语言。由于 HTML 是 XML 的一个子集,因此 XPath 也可以用于解析 HTML 文档。 在 Python...
XPath是XML的一个查询语言,它允许我们选取XML文档中的节点,如元素、属性、文本等。XPath表达式可以用来导航XML文档的结构,找到特定的节点,并对这些节点进行操作。XPath的核心在于路径表达式,类似于文件系统中的...
XPath(XML Path Language)是W3C定义的一种语言,用于在XML文档中查找信息,如节点、属性或者值。XPath通过路径表达式来选取XML文档中的节点,它是XML处理中的重要工具,尤其在数据绑定和数据处理框架中,如MyBatis...
XPath,全称为XML Path Language,是一种在XML文档中查找信息的语言。它被广泛应用于XML处理,如XSLT、XQuery以及XPointer等标准中。XPath通过路径表达式来选取XML文档中的元素、属性或其他类型的节点,使得我们可以...
XPATH是一种用于XML文档查询的语言,它能够帮助我们快速地在XML文档中查找信息。XPATH支持使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式非常灵活,可以用来选取文档中的任何类型的数据。 #### 二...
### XSLT与XPath入门:转换XML文档与数据 #### 一、XSLT与XPath基础知识 **XSLT(Extensible Stylesheet Language Transformations)**是一种基于XML的标准语言,用于将一个XML文档转换成另一种XML文档或者HTML...
本系列教程的目的是帮助开发者掌握如何使用爬虫技术,特别是XPath语言,来爬取互联网金融相关网站的数据,尤其是P2P网贷平台的理财产品信息。 在开始编写爬虫之前,需要准备一些基础工具和知识。首先,推荐使用神箭...
在描述中提到的"XSLT入门",XSLT是Extensible Stylesheet Language Transformations的缩写,是一种转换XML文档的语言。XSLT使用XPath来定位源XML中的节点,并定义如何将这些节点转换成新的XML结构或者HTML、文本等...
### XPath入门 - XSL教程详解 #### 一、XPath简介 XPath是一种强大的查询语言,用于在XML文档中查找信息。其主要目标是对XML文档的组件进行定位,同时也为字符串、数字和布尔值的操作提供了基本的功能。XPath使用...
XPath是XML路径语言,用于选取XML文档中的节点。以下是一个使用JAXB(Java Architecture for XML Binding)结合XPath的案例: ```java import javax.xml.bind.JAXBContext; import javax.xml.bind.JAXBElement; ...
XPath是一种在XML或HTML文档中查找信息的语言,它允许我们以一种简洁的方式来选取节点,比如元素、属性或者文本。在Python的网络爬虫领域,XPath经常与lxml库结合使用,用于高效地解析和提取网页内容。 lxml库是...
《深入理解DOM4J、XPath与JUnit:快速入门与实战测试》 DOM4J、XPath和JUnit是Java开发中不可或缺的三个重要工具。DOM4J是处理XML文档的一个强大库,XPath则是XML路径语言,用于在XML文档中查找信息,而JUnit则是...
本书《Beginning XSLT and XPath: Transforming XML Documents and Data》旨在为开发者提供一个坚实的XSLT处理模型基础,并通过具体实例帮助读者理解XSLT如何依赖于XPath以及其处理模型与其他编程语言的不同之处。...
XPath 则是一种在 XML(包括 HTML)文档中查找信息的语言,可以用来选取节点或者基于某些条件选取节点集合。 描述中提到的 "博文链接:https://fhqiwcw.iteye.com/blog/1462239" 提示我们,可能存在一篇详细介绍...
XPath是一种查询语言,用于在XML文档中查找信息,比如选取节点、计算数值或测试条件。XSLT(可扩展样式表语言转换)用于转换XML文档,将源XML转换成不同的结构或格式,如HTML。 XML在Web服务中的应用: XML广泛...