所有 XML 文档中的文本均会被解析器解析。
只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。
PCDATA
PCDATA 指的是被解析的字符数据(Parsed Character Data)。
XML 解析器通常会解析 XML 文档中所有的文本。
当某个 XML 元素被解析时,其标签之间的文本也会被解析:
<message>此文本也会被解析</message>
解析器之所以这么做是因为 XML 元素可包含其他元素,就像这个例子中,其中的 <name> 元素包含着另外的两个元素(first 和 last):
<name><first>Bill</first><last>Gates</last></name>
而解析器会把它分解为像这样的子元素:
<name>
<first>Bill</first>
<last>Gates</last>
</name>
转义字符
非法的 XML 字符必须被替换为实体引用(entity reference)。
假如您在 XML 文档中放置了一个类似 "<" 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:
<message>if salary < 1000 then</message>
为了避免此类错误,需要把字符 "<" 替换为实体引用,就像这样:
<message>if salary < 1000 then</message>
在 XML 中有 5 个预定义的实体引用:
< < 小于
> > 大于
& & 和号
' ' 省略号
" " 引号
注释:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。
CDATA
术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。
在 XML 元素中,"<" 和 "&" 是非法的。
"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。
某些文本,比如 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了避免错误,可以将脚本代码定义为 CDATA。
CDATA 部分中的所有内容都会被解析器忽略。
CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:
<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
</script>
在上面的例子中,解析器会忽略 CDATA 部分中的所有内容。
关于 CDATA 部分的注释:
CDATA 部分不能包含字符串 "]]>"。也不允许嵌套的 CDATA 部分。
标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。
分享到:
相关推荐
在深入探讨CDATA与PCDATA的区别之前,我们先来理解它们在XML(可扩展标记语言)中的基本概念。XML是一种用于标记数据的语言,它允许自定义标签,因此在各种应用程序之间交换数据时非常灵活。然而,XML对特殊字符的...
### XML的研究与应用 #### 一、DTD与XML文档的关系 **DTD**(Document Type Definition,文档类型定义)是XML 1.0规范的一部分,用于定义XML文档中的元素、属性及它们之间的关系。DTD的主要作用是确保XML文档符合预...
在PHP中操作XML,开发者会经常与CDATA区段打交道。对于需要在XML中包含脚本代码、HTML内容或任何包含特殊字符的数据时,CDATA区段显得尤为有用。XML文档中使用CDATA区段的方式非常简单,它由“<![CDATA[”开始,并以...
3、为第二步中得到的SpyBase1.xml、SpyBase2.xml分别编写相应的外部DTD文档,建立模式与数据之间的关联,并进行文档有效性验证。在编写的DTD文档中,要求在DTD文档中使用参数实体来替换所有的#PCDATA和CDATA。 ...
在本教程中,我们将深入探讨XML的基本概念、语法和应用,同时结合实验指导,帮助学习者掌握XML的实际操作技能。 一、XML简介 XML起源于1998年W3C发布的标准,它的主要目标是简化数据共享和交换,特别是在不同的系统...
自己将数据导入到xml中的,希望有需要的朋友可以自己下载,格式为<!DOCTYPE PCAroot[ <!ELEMENT PCAroot (Province*)> <!ELEMENT Province (City*)> <!ELEMENT City (Area*)> <!ELEMENT Area (#PCDATA)> <!...
在XML(可扩展标记语言)中...总之,XML的空白字符处理、XML声明、打印可读XML、名称空间的使用以及在VB中利用XMLDSO与XML数据交互,这些都是XML编程中常见的知识点,理解和掌握这些可以帮助开发者更好地处理XML文档。
XML 文档中的文本信息不能包含特殊字符,如 `,若需使用,可以使用 CDATA 部分包裹。例如: ```xml <![CDATA[This is some arbitrary text <within> a CDATA!]]> ``` 元素可以有属性,属性用来提供额外的信息。例如...
在IT行业中,XML因其结构清晰、可扩展性强的特点,被广泛应用于数据交换、配置文件、Web服务等领域。 ### XML的基本结构 XML文档由一系列元素组成,每个元素都由开始标签和结束标签包围,例如`<element>`和`...
- 文档头定义了XML版本与编码格式。 - 使用DTD(Document Type Definition)来规范文档结构。 - 主体部分包含两个主要元素:`<info>` 和 `<messages>`。 3. **XML文档实例**: ```xml <?xml version="1.0" ...
XML,全称可扩展标记语言(Extensible Markup Language),在软件开发中扮演着重要的角色,尤其是在配置文件、数据表示和异构系统交互方面。本文将深入探讨XML在开发中的应用。 首先,XML常被用作配置文件。XML的...
XML的主要优点包括数据与显示分离、结构化数据存储以及跨平台兼容性。 - **用途**: - **通信标准**:在AJAX、XML和JSON等技术中,XML常作为数据交换格式,使得客户端和服务器之间能传递结构化的信息。 - **配置...
在XMLSpy中,你可以创建和编辑DTD,然后将XML文档与之关联,进行实时验证,查看错误或警告。 在实验中,你需要创建一个XML文档(如book.xml),然后定义相应的DTD。DTD可以放在XML文档的内部(通过`<!DOCTYPE>`声明...
Entities 是 XML 文档中的一种特殊的符号,用于表示特殊的字符。PCDATA 是一种 parsed character data,用于表示文本数据。CDATA 是一种 character data,用于表示不需要解析的文本数据。 DOM4J 是一个 Java 库,...
总的来说,从提供的内容中可以提取出XML的基础概念,特殊字符的处理方式,DTD的定义方法,处理指令的使用,以及实体与属性的声明和使用等知识点。这些知识点对于理解XML的基本结构和开发基于XML的应用至关重要。
它主要用于描述XML文档中元素、属性以及实体等组成部分的规则,确保XML文档符合预定义的标准。 **为什么需要DTD?** - **一致性验证**:DTD使得不同的组织或个人可以使用同一套规则来创建和验证XML文档,确保数据的...
与HTML类似,XML同样使用标签来组织数据,但不同之处在于XML更加关注数据本身而非数据的显示方式。 #### 二、XML文档的基本构成 在深入探讨XML的具体结构之前,我们首先需要了解一个完整的XML文档通常由哪些部分...
### XML自学总结与知识点解析 XML(eXtensible Markup Language)是一种用于标记电子文档的规范,被设计用来传输和存储数据。以下是从标题、描述、标签及部分内容中提炼出的关键知识点,旨在全面理解XML的基本概念...
在XML应用开发中,DTD(Document Type Definition)是一个重要的组成部分,它用于定义XML文档的结构和语法规则。本篇内容主要讨论了如何在DTD中设置属性的取值类型,包括CDATA和枚举型。 首先,我们要理解CDATA和#...
在数据库管理和应用开发中,经常需要将数据库中的数据转换成XML格式,以便于与其他系统进行数据交换或进行进一步的数据处理。Oracle提供了丰富的工具和API来支持这种转换,其中就包括通过存储过程实现的数据到XML的...