XML 文档对象模型 (DOM)
能够以编程方式读取、处理和修改 XML 文档。
XPath 表达式
XPath 表达式使用路径表示法(与 URL 中使用的路径表示法类似)寻址 XML 文档的各个部分。表达式计算为生成子元素集、布尔值、数字或字符串类型的对象。
URL与XPath 表达式比较
URL: 由文件系统中的文件夹和文件组成的层次结构。
每个级别具有唯一名称的文件。URL 总是标识单个文件。
相对特定文件夹(称为“当前文件夹”)进行计算。
XPath: 由 XML 文档中的元素和其他元素组成的层次结构。
每个级别的元素名可能不是唯一的。XPath 表达式标识所有匹配的元素集。
相对特定元素(称为表达式的“上下文”)进行计算。
基本 XPath 表达式 (判断是谁的集合!!)
1.当前上下文
以句点和正斜杠 (./) 作为前缀的表达式明确使用当前上下文作为上下文。例如,以下表达式引用当前上下文中的所有 <author> 元素:
./author
注意,此表达式等效于以下表达式:
author
2.文档根
以正斜杠 (/) 为前缀的表达式使用文档树的根作为上下文。例如,以下表达式引用此文档根的 <bookstore> 元素:
/bookstore
3.根元素
使用正斜杠后接星号 (/*) 的表达式将使用根元素作为上下文。例如,以下表达式查找文档的根元素:
/*
4.递归下降
用双正斜杠 (//) 的表达式指示可以包括零个或多个层次结构级别的搜索。如果此运算符出现在模式的开头,上下文相对于文档的根。例如,以下表达式引用当前文档中任意位置的所有 <author> 元素:
//author
.// 前缀指示上下文从层次结构中当前上下文所指示的级别开始。
5.特定元素
以元素名开头的表达式引用特定元素的查询,从当前上下文节点开始。例如,以下表达式引用当前上下文节点中 <images> 元素内的 <background.jpg> 元素:
images/background.jpg
以下表达式引用当前上下文节点中 <bookstore> 元素内的 <book> 元素的集合:
bookstore/book
以下表达式引用当前上下文节点中的所有 <first.name> 元素:
first.name
XPath 表达式是使用下表中所示的运算符和特殊字符构造的。
运算符和特殊字符:
/ 子运算符;选择左侧集合的直接子级。此路径运算符出现在模式开头时,表示应从根节点选择该子级。
// 递归下降;在任意深度搜索指定元素。此路径运算符出现在模式开头时,表示应从根节点递归下降。
. 指示当前上下文。
.. 当前上下文节点的父级。
* 通配符;选择所有元素,与元素名无关。
@ 属性;属性名的前缀。
@* 属性通配符;选择所有属性,与名称无关。
: 命名空间分隔符;将命名空间前缀与元素名或属性名分隔。
( ) 为运算分组,明确设置优先级。
[ ] 应用筛选模式。
[ ] 下标运算符;用于在集合中编制索引。
+ 执行加法。
- 执行减法。
div 根据 IEEE 754 执行浮点除法。
* 执行乘法。
mod 从截断除法返回余数。
优先级 字符 用途
1 ( ) 分组
2 [ ] 筛选器
3 / // 路径运算
分组运算符()仅适用于顶级路径表达式。
例如:
(//author/degree | //author/name) 是有效的分组运算
//author/(degree | name) 不是有效的分组运算
筛选模式运算符 [] 的优先级高于路径运算符(/ 和 //)。
例如:
//comment()[3]
选择相对于文档中任意位置comment的父级索引等于3的所有comment,可以返回多个备注
(//comment())[3]
选择相对于父级的所有comment集中的第三个comment,只能返回一个备注。
author/first-name
当前上下文节点的 <author> 元素中的所有 <first-name> 元素。
bookstore//title
<bookstore> 元素中更深的一级或多级(任意子代)的所有 <title> 元素。注意,此表达式与以下模式 bookstore/*/title 不同。
bookstore/*/title
属于 <bookstore> 元素的孙级的所有 <title> 元素。
bookstore//book/excerpt//emph
<book> 元素的 <excerpt> 子级中的任意位置和 <bookstore> 元素中的任意位置的所有 <emph> 元素:
.//title
当前上下文中更深的一级或多级的所有 <title> 元素。注意,本质上只有这种情况需要句点表示法。
通配符
通过使用通配符 * 集合,不使用元素名即可引用元素。* 集合引用作为当前上下文的子级的所有元素,与名称无关。
例如:
author/*
<author> 元素的所有元素子级。
book/*/last-name
所有作为 <book> 元素的孙级的 <last–name> 元素。
*/*
当前上下文的所有孙级元素。
my:book
my 命名空间中的 <book> 元素。
my:*
my 命名空间中的所有元素。
属性
XPath 使用 @ 符号表示属性名。属性和子元素应公平对待,两种类型之间的功能应尽可能相当。
例如:
@style
当前元素上下文的 style 属性。
price/@exchange
当前上下文中 <price> 元素的 exchange 属性。
book/@style
所有 <book> 元素的 style 属性。
@*
当前上下文节点的所有属性。
@my:*
my 命名空间中的所有属性。不包括 my 命名空间中的元素的未限定属性。
注意:
属性不能包含子元素,所以,如果对属性应用路径运算符,将出现语法错误。此外,不能对属性应用索引,因为根据定义,不为属性定义任何顺序。
price/@exchange/total
比较
运算符:
and 逻辑与
or 逻辑或
not() 非
= 相等
!= 不相等
< 小于
<= 小于或等于
> 大于
<= 大于或等于
| 集运算;返回两个节点集的联合
例如:
author[last-name = "Bob"]
至少包含一个值为 Bob 的 <last-name> 元素的所有 <author> 元素。
author[last-name[1] = "Bob"]
第一个 <last-name> 子元素的值为 Bob 的所有 <author> 元素。
author/degree[@from != "Harvard"]
包含 from 属性不等于 "Harvard" 的 <degree> 元素的所有 <author> 元素。
author[last-name = /editor/last-name]
包含与根元素下 <editor> 元素中的 <last-name> 元素相同的 <last-name> 元素的所有 <author> 元素。
author[. = "Matthew Bob"]
所有字符串值为 Matthew Bob 的 <author> 元素。
集运算
Union (|) 运算符
|(即 union)运算符返回两个操作数的联合,操作数必须是节点集。例如,//author | //publisher 返回的节点集结合了所有 //author 节点和所有 //publisher 节点。
例如:
first-name | last-name
包含当前上下文中的 <first-name> 和 <last-name> 元素的节点集。
(bookstore/book | bookstore/magazine)
包含 <bookstore> 元素中的 <book> 或 <magazine> 元素的节点集。
book | book/author
包含 <book> 元素中的所有 <book> 元素和所有 <author> 元素的节点集。
(book | magazine)/price
包含 <book> 或 <magazine> 元素的所有 <price> 元素的节点集。
筛选器和筛选模式
通过将筛选子句 [pattern] 添加到集合中,可以对任何集合应用约束和分支。筛选器类似于 SQL WHERE 子句。筛选器中包含的模式称为“筛选模式”。
例如:
book[excerpt]
至少包含一个 <excerpt> 元素的所有 <book> 元素。
book[excerpt]/title
至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <title> 元素。
book[excerpt]/author[degree]
至少包含一个 <degree> 元素并且在至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <author> 元素。
book[author/degree]
至少包含一个 <author> 元素并且该元素至少包含一个 <degree> 子元素的 <book> 所有元素。
book[excerpt][title]
至少包含一个 <excerpt> 元素以及至少包含一个 <title> 元素的 <book> 所有元素。
分享到:
相关推荐
XML(eXtensible Markup Language)是一种用于标记...而提供的“八套Xml文档对象模型Dom书籍文档资料”应该包含了深入浅出的DOM理论讲解、实践案例分析以及相关的API使用指南,对于深入学习DOM和XML处理非常有价值。
此外,Node接口还提供了其他属性和方法,如`nodeName`(节点名)、`nodeValue`(节点值)、`ownerDocument`(所属文档对象)、`childNodes`(子节点列表)等,使得开发者能够轻松地遍历和操作XML文档。 在实际应用...
DOM将XML文档解析为一个对象树,每个XML元素、属性、文本等都有相应的DOM对象表示。这使得程序员可以方便地创建、查询、修改和更新文档的任何部分。 在DOM下,XML文档的每个元素都可以被看作树中的一个节点,节点有...
3. **XML DOM**:用于处理XML文档的DOM实现,强调数据的结构和语义。 #### 四、DOM与BOM的关系 在Web开发中,DOM通常与浏览器对象模型(Browser Object Model,简称BOM)协同工作。BOM提供了浏览器级别的抽象,包括...
XML 文档对象模型定义访问和操作XML文档的标准方法。 DOM 将 XML 文档作为一个树形结构,而树叶被定义为节点。
文档对象模型(DOM)是Web开发中的核心技术,它允许开发者通过JavaScript等脚本语言来动态地访问和修改HTML或XML文档的结构、内容和样式。DOM是一个标准的接口,它将文档表示为一棵由节点组成的树,每个节点代表文档...
1. **DOM核心**: DOM的核心规范适用于任何结构化的XML文档,它定义了一种统一的方式来访问和操作文档内容。核心DOM提供了创建、访问和修改节点的方法,例如`createElement()`, `appendChild()`, `removeChild()`等。...
本笔记将深入探讨如何使用DOM(文档对象模型)和DOM4J库来创建XML文档。 一、DOM解析器 DOM是W3C推荐的一种XML解析标准,它将整个XML文档加载到内存中,形成一棵树形结构,称为DOM树。通过DOM,我们可以方便地访问...
### 文档对象模型(DOM)的关键知识点 #### DOM 基本概念 文档对象模型(DOM,Document Object Model)是一种跨平台和语言中立的接口,使得程序和脚本能够动态地访问和更新文档的内容、结构和样式。DOM 主要用于...
DOM同样适用于XML文档,允许开发者用相同的方式来操作XML文档的结构和内容。 **Ajax与DOM** Ajax(Asynchronous JavaScript and XML)技术允许网页在不重新加载整个页面的情况下更新部分内容。通过创建...
DOM文档对象模型允许开发人员通过JavaScript或其他脚本语言与HTML或XML文档进行交互,例如添加、删除或修改文档元素。这个模型将整个文档视为一棵树,每个节点代表文档的一部分,如元素、属性、文本等。在DOM中,...
总的来说,“xmldom对象模型手册”应该包含了关于创建、遍历、修改和操作XML文档的详细指南,这对于需要处理XML数据的前端开发者或是需要构建动态Web应用程序的人来说是非常有价值的参考资料。通过学习这个手册,你...
**DOM文档对象模型** DOM(Document Object Model)是万维网联盟(W3C)制定的一种标准,它提供了一种结构化的表示XML或HTML文档的方法,并允许编程语言与这些文档进行交互。DOM将整个文档视为一个由节点组成的树形...
1. **加载和解析**:使用DOM解析器将XML文档加载到内存中并构建DOM树。 2. **访问节点**:通过节点的层级关系(如父节点、子节点、兄弟节点)进行查找。 3. **修改节点**:可以创建新节点、删除现有节点、修改节点...
3. **XML文档对象模型DOM**: DOM是处理XML文档的一种标准方式,它将整个XML文档加载到内存中形成一棵树形结构,每个节点代表XML的一个部分。XML4J可能使用DOM来构建和操作XML文档。 4. **XML4J源码分析**: 学习XML4...
文档对象模型(Document Object Model,DOM)是一种标准,它提供了表示和操作HTML、XML文档的接口。DOM将网页或XML文档解析成一个结构化的对象树,每个部分都可以通过JavaScript或其他编程语言进行访问和修改,从而...
**DOM文档对象模型**是网页开发中的一个核心概念,它提供了一种结构化的方式来处理HTML或XML文档。通过DOM,开发者能够以编程的方式创建、访问和修改文档的内容、结构及样式。本文档基于W3C发布的DOM Level 1规范第...
文档对象模型(DOM)是Web开发中的一个关键概念,它为HTML和XML文档提供了一个结构化的表示,并允许程序和脚本动态地访问和更新文档内容、结构和样式。DOM是独立于语言的标准,这意味着任何支持DOM的编程语言都可以...