来源:http://www.cnblogs.com/chenqingwei/archive/2010/04/21/1717237.html
操作XML文件时,如果允许用户输入内容,例如∶"< "、">"、"/"、""等,当生成XML时,会破坏了XML结构,使数据中断。
这就要用XML CDATA
在XML文档中的所有文本都会被解析器解析。
只有在CDATA部件之内的文本会被解析器忽略。
--------------------------------------------------------------------------------
解析数据
XML 解析器通常情况下会处理XML文档中的所有文本。
当XML元素被解析的时候,XML元素内部的文本也会被解析:
< message>This text is also parsed< /message>
XML解析器这样做的原因是XML元素内部可能还包含了别的元素,象下面的例子,name元素内部包含了first和last两个元素:
< name>< first>Bill< /first>< last>Gates< /last>< /name>
解析器会认为上面的代码是这样的:
< name>
< first>Bill< /first>
< last>Gates< /last>
< /name>
--------------------------------------------------------------------------------
转义字符
不合法的XML字符必须被替换为相应的实体。
如果在XML文档中使用类似"< " 的字符, 那么解析器将会出现错误,因为解析器会认为这是一个新元素的开始。所以不应该象下面那样书写代码:
< message>if salary < 1000 then< /message>
为了避免出现这种情况,必须将字符"< " 转换成实体,象下面这样:
< message>if salary < 1000 then< /message>
下面是五个在XML文档中预定义好的实体:
< < 小于号
> > 大于号
& & 和
' ' 单引号
" " 双引号
实体必须以符号"&"开头,以符号";"结尾。
注意: 只有"< " 字符和"&"字符对于XML来说是严格禁止使用的。剩下的都是合法的,为了减少出错,使用实体是一个好习惯。
--------------------------------------------------------------------------------
CDATA部件
在CDATA内部的所有内容都会被解析器忽略。
如果文本包含了很多的"< "字符和"&"字符——就象程序代码一样,那么最好把他们都放到CDATA部件中。
一个 CDATA 部件以"< ![CDATA[" 标记开始,以"]]>"标记结束:
< script>
< ![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1
}
else
{
return 0
}
}
]]>
< /script>
在前面的例子中,所有在CDATA部件之间的文本都会被解析器忽略。
CDATA注意事项:
CDATA部件之间不能再包含CDATA部件(不能嵌套)。如果CDATA部件包含了字符"]]>" 或者"< ![CDATA[" ,将很有可能出错哦。
同样要注意在字符串"]]>"之间没有空格或者换行符
相关推荐
为了解决这个问题,我们可以使用CDATA(Character Data)段来封装这些文本,使得XML解析器将其视为纯文本处理,不进行任何解析。 CDATA的定义格式是 `<![CDATA[ 文本内容 ]]>`,其中"文本内容"部分不能包含字符串"]...
### XML中的CDATA用法详解 #### 一、CDATA的基本概念 **CDATA**(Character Data)是一种特殊的文本区域,它被XML解析器视为纯文本数据,并不会对其进行解析或处理。这意味着在CDATA段落内的任何XML标签或者实体引用...
在XML文档中,CDATA(Character Data)区域用于包含不受解析的文本数据,通常用于包含特殊字符或者JavaScript代码。在处理XML时,有时我们需要读取或写入CDATA节中的内容。ASP.NET 3.5及以上版本提供了内置的序列化...
本文档包含了一个完整的实例,可以实现含有CDATA 的字符串转换成xml
C#读取XML的CDATA节点内容实例详解 在本篇文章中,我们将详细介绍如何使用C#语言读取XML文件中的CDATA节点内容。CDATA节点是一种特殊的XML节点,用于存储不需要被XML解析器解析的文本数据。在实际开发中,我们经常...
XML CDATA部分是XML文档中的一个特殊区域,它允许您在其中包含任意文本,包括那些在XML文档中通常具有特殊意义的字符,如小于号(")和和号("&")等。XML解析器在处理XML文档时会忽略CDATA部分内的所有内容,因此,您...
在本文中,我们将深入探讨如何使用TinyXML2来解析和创建XML文件,特别是涉及到CDATA区段和元素的多属性处理。 首先,让我们了解XML的基本概念。XML(Extensible Markup Language)是一种用于存储和传输结构化数据的...
本文将深入探讨XML与JavaBean之间的转换、XML标签的大小写规则、XML特殊符号的处理以及CDATA的生成。 1. XML转JavaBean: 在Java编程中,XML数据经常需要转换为Java对象以便于操作。这一过程通常通过XML解析器来...
为了保证XML的格式正确,避免解析错误,我们需要将这部分内容用CDATA标签包裹起来。CDATA部分会告诉XML解析器忽略内部文本中的特殊字符,如", ">", "&"等,它们会被当作普通字符处理。 PHP提供了DOMDocument类用于...
在XML文档中,CDATA(字符数据)区段被用来包含不能由XML解析器解释的特殊字符,例如尖括号()和 ampersand(&)。在处理XML时,有时我们需要对CDATA进行操作,例如读取、写入或者解析。本文将详细探讨如何在C#环境...
[CDATA[<h2>.NET 开发]]> <siteurl>//www.jb51.net</siteurl></net>我们可以采用下面的方法修改 CDATA 节点的内容。 C# 代码 代码如下:System.Xml.XmlDocument d = new System.Xml.XmlDocument();d.Load(Server....
在提供的压缩包文件中,`CDataContentHandler.java`应该是实现了上述的ContentHandler,而`cdata_sample.xml`是一个包含CDATA段的XML示例文件。你可以参考这两个文件,结合上述步骤在你的项目中实现XML的SAX解析。
为了防止这些特殊字符被解析器解析,XML定义了CDATA区段(Character Data Sections),用以包含不希望被解析器进行解析的文本数据。 在PHP中操作XML,开发者会经常与CDATA区段打交道。对于需要在XML中包含脚本代码...
Java对象与XML之间的转换是Java开发中常见的需求,特别是在数据交换、配置文件存储或Web服务交互等场景。本文将深入探讨如何实现Java对象到XML以及XML到Java对象的转换。 首先,Java对象到XML的转换通常涉及到Java...
在深入探讨CDATA与PCDATA的区别之前,我们先来理解它们在XML(可扩展标记语言)中的基本概念。XML是一种用于标记数据的语言,它允许自定义标签,因此在各种应用程序之间交换数据时非常灵活。然而,XML对特殊字符的...
超全面javaweb第4天-_10_xml的CDATA区
在本讲中,我们将深入探讨PHP与XML的结合使用,特别是关于CDATA、实体字符处理以及DTD(Document Type Definition)的快速入门。XML是一种强大的数据交换格式,它允许我们以结构化的方式存储和传输数据。而PHP作为一...
与上一个版本一起使用可以可以起到提高效率的目的。本人解析xml的真实文档