- 浏览: 96425 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
xiaohee:
好文章,谢谢!
XML教程——XPath实例详解 -
hapychina:
static属性和方法要分配内存,不是static的就不分配了 ...
讨论:单例和静态方法的深入讨论 -
giianhui:
就目前的工作来说,我认为很有必要
深入JVM——方法区 -
hyj1254:
深有体会啊,搞java的很难通过证明自己技术有多nb来打动面试 ...
你适合学习java吗 -
wupuyuan:
我说说我的看法吧。1、物理内存角度来说,加载代码的内存消耗在整 ...
讨论:单例和静态方法的深入讨论
一个“有效的”文件首先应该是“形式良好”的。但这还远远不够,它还要往前更进一步。一个XML文件必须遵守文件类型描述Dtd(Document Type Definition)中定义的种种规定。所有的文件都是由序言和文件体构成的。序言中包含了XML声明,在序言中还可以包含Dtd定义。
最简单的使用Dtd的方法是在XML文件的序言部分加入一个Dtd描述,加入的位置是紧接在XML处理指示之后。一个包含Dtd的XML文件的结构为:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <?DOCTYPE 根元素名[ 元素描述 ]> 文件体....... |
这样,我们就定义了一个文件,它以DOCTYPE中规定的根元素名作为其根元素的名字。
如果为每一个XML文件加入一段Dtd定义,是相当繁琐的。而且,更多的情况下,我们会为一批XML文件定义一个相同的Dtd。例如,对于报社中的每篇稿件,它们都有相同的格式,可以采用一个统一的Dtd,为每一篇单独定义既麻烦,又不利于统一格式。好在XML规范为我们提供了解决这个问题的方法,它就是外部Dtd。
外部Dtd的好处是:它可以方便高效地被多个XML文件所共享。你只要写一个Dtd 文件,就可以被多个XML文件所引用。事实上,当许多组织需要统一它们的数据交换格式时,它们就是通过外部Dtd来完成的。这样做不仅简化了输入工作,还保证当你需要对Dtd做出改动时,不用一一去改每个引用了它的XML文件,只要改一个公用的Dtd文件就足够了。
为了引用一个外部Dtd,必须修改XML声明和DOCTYPE声明。
XML声明中必须说明这个文件不是自成一体的,即standalone属性的属性值不再是yes了:
<?xml version = "1.0" encoding="Gb2312" standalone = "no"?> |
在DOCTYPE声明中,应该加入SYSTEM属性:<!DOCTYPE 根元素名 SYSTEM "外部Dtd文件的URL">
例如:
<!DOCTYPE 联系人列表 SYSTEM "http://www.mydomain.com/dtds/fclml.dtd"> |
上面的URL是一个绝对路径,除此以外,它还可以是一个相对路径,如: <!DOCTYPE 联系人列表 SYSTEM "fclml.dtd"> 它说明这个Dtd文件和引用它的XML文件在同一个目录下。
使用这种方法,你可以方便地把Dtd文件从你的XML文件中分离出来,粘贴到另一个文件fclml.dtd中。这样,你就得到一个Dtd文件和一个有效的XML文件。
使用外部Dtd时,要在DOCTYPE中使用关键字SYSTEM。实际上,SYSTEM不是引用外部Dtd的唯一方法,这个关键字主要用于引用一个作者或组织所编写的众多 XML文件中通用的Dtd。还存在一种外部Dtd,它是一个由权威机构制订的,提供给特定行业或公众使用的Dtd。因此,另一个引用外部Dtd的办法是使用关键字 PUbLIC,引用这一类公开给公众使用的Dtd。
当使用关键字PUbLIC进行引用时,这个外部Dtd还需要得到一个标识名。引用公共Dtd的形式为: <!DOCTYPE 根元素 PUbLIC "Dtd名称" "外部Dtd的URL">
请见下面例子:
<!DOCTYPE 联系人列表 PUbLIC "联系人Dtd" "http://www.mydomain.com/dtds/fclml.dtd"> |
这个Dtd标识的命名规则和XML文件的命名规则稍有不同。具体地说,Dtd名称只能包含字母、数字、空格和下面的符号:_%$#@()+:=/!*;?。同时,Dtd名称还必须符合一些标准的规定。例如,ISO标准的Dtd以“ISO”三个字母开头;被改进的非ISO 标准的Dtd以加号“+”开头;未被改进的非ISO标准的Dtd以减号“-”开头。
无论是哪一种情况,开始部分后面都跟着两个斜杠“//”及Dtd所有者的名称。在这个名称之后又是两个斜杠“//”,再然后是Dtd所描述的文件的类型。最后,在又一对斜杠之后是语言的种类(参见ISO 639)。例如下面这个公用Dtd的引用:
<!DOCTYPE 联系人列表 PUbLIC "-//Luna Dong//Contact Data//CN" "http://www.mydomain.com/dtds/fclml.dtd"> |
看上去的确比较复杂,不过没关系,对于Dtd的命名通常不是它的引用者的任务,XML 文件的编写者只要在自己的文件中把事先定义好的Dtd名称放在相应的位置中就可以了。
一个Dtd不仅要告诉语法分析器它所关联的XML文件的根元素是什么,而且还要告诉语法分析器文件的内容和结构,说清文件结构中的每一个细节。为了定义这些细节,我们必须展开Dtd中元素说明部分,使用元素类型声明(Etd)来声明所有有效的文件元素。
Etd不但说明了每个文件中可能存在的元素,给出了元素的名字,而且给出了元素的具体类型。一个XML元素可以为空,也可以是一段纯文本,还可以有若干个子元素,而这些子元素同时又可以有它们的子元素。Dtd正是通过元素之间的父子关系,描述了整个文件的结构关系。
Etd应该采用如下的结构: <!ELEMENT 元素名 元素内容描述>
因此,在前面的例子里,可以在文件序言中通过如下方式定义“联系人列表”这个元素:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> ]> <联系人列表> ... </联系人列表> |
这个Dtd定义了一个XML文件,它只有一个根元素,名为“联系人列表”,这个元素可以有任何类型的子元素,也可以是纯文本,还可以为空。
但是需要注意,尽管元素“联系人列表”被定义为“可以”包含其它元素,但实际上这个 Dtd除了“联系人列表”元素本身外没有定义任何其它元素,所以也就没有其它元素可以用作“联系人列表”的子元素。“有效的”XML文件规定文件中所使用的任何元素都必须在Dtd中给出定义。
在“ANY”定义下使用任何纯文本都是无须另加说明的,这一点与元素不同。故而,在相同的Dtd定义下,下面一段XML文件则是合法的:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> ]> <联系人列表> 纯文本信息说明联系人信息 </联系人列表> |
为了使元素“联系人列表”中还可以包含其它元素,从而使前面的那个文件是“有效 的”,我们还需要定义元素“联系人”和“姓名”。
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人(姓名)> <!ELEMENT 姓名(#PCDATA)> ]> <联系人列表> <联系人> <姓名>张三</姓名> </联系人> </联系人列表> |
现在我们已经定义了一个XML文件,它的根元素名为“联系人列表”。“联系人列表” 中可以包含任何纯文本数据,也可以含有子元素(这即是ANY的含义)。根据后面的定义,我们知道,“联系人列表”中可以包含子元素“联系人”,也可以直接包含子元素“姓名”;“联系人”元素又可以包含自己的子元素,名为“姓名”;而“姓名”则只能包含纯文本数据(即(#PCDATA))。
注意:
- 除了根元素外,在定义其它元素时使用关键字ANY都是不好的习惯。
- 在定义元素时,Etd的顺序是无关紧要的。
- 还有一点要注意,不能对不同的元素使用相同的元素名,即便这些元素的内容、包含的子元素不同也不行,因为它只会引起文件各个元素的混淆,使文件的可读性大打折扣。
- 元素名的第一个字母必须是字母、或下划线(_)、或冒号(:),后跟字母、数字、句号(.)、冒号、下划线、连结号(-)的组合,并且不能包含空白符,不能以 “xml”开头。尽管XML1.0标准允许使用任何长度的文件名,但是实际的XML处理器常常会限制标记名的长度。
对于以下的例子:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人(姓名)> <!ELEMENT 姓名(#PCDATA)> ]> <联系人列表> <联系人> <姓名>张三</姓名> </联系人> </联系人列表> |
准确的说法是,元素“联系人”必须包含一个,且只能包含一个子元素“姓名”。可如果子元素是“EMAIL地址”怎么办?联系人可能根本没有自己的EMAIL邮箱,也可能有好几个EMAIL帐号。
使用正则表达式,我们就可以解决上述问题,描述父元素与子元素之间非常复杂的关系。例如,你可以对一个元素作如下任何一种类型的定义:它有一个子元素,有一个或多个子元素,有零个或多个子元素,至少有一个子元素。你还可以定义复合关系,比如“元素X是有效的,如果它含有一个或多个子元素Y,或一个子元素Z”。
元素定义是由它们的元素内容模型(ECM)来描述的,也就是说,是由紧跟元素后面的括号中的内容来定义的。因此,正如我们前面见到的,元素“联系人”的ECM被描述为子元素“姓名”: <!ELEMENT 联系人(姓名)>
ECM中的内容采取一组正则表达式的形式。在下表中,我们列出了正则表达式中可能出现的元字符:
元字符 | 含义 |
+ | 出现一次或多次 |
* | 出现零次或多次 |
? | 可选,不出现或出现一次 |
() | 一组要共同匹配的表达式 |
| OR,或,AND | 要求严格遵从顺序要求 |
下面几节中,我们将通过一些例子具体讲解这些元字符的用法,对使用正则表达式来定义ECM的方法获得一些感性认识。
一个元素的各个子元素之间可以以任意顺序出现,也可以强制遵循一定的顺序。
考虑下面的Dtd定义:
<!ELEMENT 联系人(姓名 EMAIL)> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> |
遵从这个Dtd的XML文件可以为:
<联系人> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> </联系人> |
同样,下面这个XML文件也是有效的:
<联系人> <EMAIL>zhang@aaa.com</EMAIL> <姓名>张三</姓名> </联系人> |
由于我们在Dtd定义中仅仅用空白符分隔了元素“联系人”的两个子元素,这说明我们并没有严格要求两个元素出现的顺序,因此上面两种写法都是允许的。如果我们使用逗号“,”来分隔两个子元素,那么XML文件中,元素“姓名”就必须出现在元素“EMAIL”前面。
让我们再把上节的例子作一个小小的改动:
<!ELEMENT 联系人(姓名,EMAIL+)> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> |
让我们看看前面给出的正则表达式的元字符集列表,它说明一个“联系人”元素中必须含有一个“姓名”元素,后面接一个或多个“EMAIL”元素。这样,下面的这段XML 文件是“有效的”。
<联系人> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> <EMAIL>zhang@hotmail.com</EMAIL> <EMAIL>zhang@yahoo.com</EMAIL> </联系人> |
那么下面这段XML文件不是有效的,因为它没有“EMAIL”元素,而“+”代表了“一个或多个”。
<联系人> <姓名>张三</姓名> </联系人> |
如果你需要表示“零个或多个”,那么应该使用字符“*”。例如:
<!ELEMENT 联系人(姓名,EMAIL*)> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> |
子元素可以使用括号并为一组。因此,下面的Dtd片段说明,一个“联系人”元素中可以有一个或多个“姓名/EMAIL”子元素对,并且在每个子元素对中,“姓名”都放在“EMAIL”之前。
<!ELEMENT 联系人(姓名,EMAIL)+> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> |
符合这个Dtd的XML文件可以是:
<联系人> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> <姓名>李四</姓名> <EMAIL>li@bbb.org</EMAIL> <姓名>王五</姓名> <EMAIL>wang@ccc.org</EMAIL> </联系人> |
注意,仅仅是因为“+”由括号里面移到括号外面,元素“联系人”的内容就大大不同了。
号“|”描述了一个OR操作。因此,下面的Dtd片段所规定的XML元素是:所有的 “联系人”元素应该有一个“姓名”子元素,同时,在此之后还应该有一个“电话”或一个“EMAIL”元素,但不能同时有“电话”和“EMAIL”两个元素。
<!ELEMENT 联系人(姓名,(电话|EMAIL))> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT 电话(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> |
一个符合上述Dtd定义的“有效的”XML文件的定义应该是:
<联系人> <姓名>张三</姓名> <电话>12345678</EMAIL> </联系人> |
或者是:
<联系人> <姓名>张三</姓名> <EMAIL>zhang@yahoo.com</EMAIL> </联系人> |
注意:在一个组中,只允许使用一种连接符(例如“,”或“|”)。因此,象下面这样定义的Dtd是不合法的:<!ELEMENT 联系人(姓名,电话|EMAIL)>
要想使用多种连接符,只有通过创建子组的方式,使用<!ELEMENT 联系人(姓名,(电话|EMAIL))>
字符“?”说明一个子元素是可选的,它可以出现,也可以不出现。因此,在下面的Dtd 中,我们规定,每一个“联系人”都必须有一个“姓名”子元素,同时或者有一个“电话” 子元素,或者有一个“EMAIL”子元素,此外,它还可以包含一个“地址”子元素,也可以不包含这种元素。
<!ELEMENT 联系人(姓名,(电话|EMAIL),地址?)> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT 电话(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> <!ELEMENT 地址(街道,城市,省份)> <!ELEMENT 街道 (#PCDATA)> <!ELEMENT 城市 (#PCDATA)> <!ELEMENT 省份 (#PCDATA)> |
根据这个Dtd描述,下面的XML片段是“有效的”:
<联系人> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> <地址> <街道>五街1234号</街道> <城市>北京市</城市> <省份>北京</省份> </地址> </联系人> |
同样,下面这段不包含“地址”元素的XML片段也是“有效的”:
<联系人> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> </联系人> |
当然,可能也有一些时候,你在一个元素中既希望包含子元素,也希望包含纯文本。 XML中允许这种使用方法,并把这种元素称为混合内容的元素。在下面的例子中, “联系人”就是一个混合元素。
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE CONTACTS [ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人(姓名|电话|EMAIL|#PCDATA)*> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT 电话(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> ]> <联系人列表> <联系人> <姓名>张三</姓名> <电话>(010)62345678</电话> <EMAIL>zhang@aaa.com</EMAIL> 这是关于张三的信息 </联系人> </联系人列表> |
注意,由于在“(姓名|电话|EMAIL|#PCDATA)”之外有“*”,所以在元素“联系人”中可以包含零个或多个“姓名”、电话、EMAIL和纯文本字段。
还有一种情况没有说,那就是,一个元素中不包含任何子元素,也不包含纯文本。对于这种情况,我们可以定义一个空标记。当然,定义这样一个标记很简单,你只需要使用关键字EMPTY就可以了,例如:<!ELEMENT HR EMPTY> 这样,在你的XML文件中,就可以使用一个空元素<HR/>。
现在我们已经学会如何定义一个元素以及它的内容,如何描述父元素与子元素之间错综复杂的关系,只差不知道如何定义元素的属性了。
在第二篇教程中我们曾经提到过属性,那个例子是一个有关“商品”的元素,它有两个属性,即“类型”和“颜色”:<商品 类型 = "服装" 颜色 = "黄色">
在Dtd中定义属性时,我们使用下面的格式: <!ATTLIST 元素名 (属性名 属性类型 缺省值)*>
元素名是属性所属的元素的名字,在上面例子中,元素名是“商品”;属性名是属性的命名,例子中,“类型”和“颜色”是属性名;缺省值说明在XML文件中,如果没有特别说明属性的取值,语法分析器默认它具有的取值;属性类型则用来指定该属性是属于十个有效属性类型中的哪种类型。
注意:由于ATTLIST是一个属性的列表,它可以包含很多属性,在实际应用中,一个元素也经常有多个属性。
上面例子中的属性可以如下定义:
<!ATTLIST 商品 类型 CDATA #REQUIRED 颜色 CDATA #IMPLIED > |
在元素说明的四个部分中,我们需要再详细讨论一下元素类型和缺省值。在下一节中,我们就从缺省值说起。
根据XML文件是否必须为一个属性提供取值,属性的缺省值又可以分为以下三类:
- 必须赋值的属性
关键字REQUIRED说明XML文件中必须为这个属性给出一个属性值。例如,假设你想定义一个"页面作者"元素,并把这个元素加入所有网站中的每一个页面。之所以定义这个元素,是为了页面编辑者能够提供他的联系信息,以便当发现页面错误或无效链接时,可以及时地通知他。在这种情况下,每个页面作者都有不同的个人信息,所以你无法事先知道应该用什么作为缺省值,但你又的确需要提供每个人的信息。这时候,你就可以把与联系信息相关的属性定义为必须的(REQUIRED),而且不用提供缺省值。 - 属性值可有可无的属性
当使用IMPLIED关键字时,文法解释器不再强行要求你在XML文件中给该属性赋值,而且也无须在Dtd中为该属性提供缺省值。可以说,这是对属性值有无的最低要求,现实中经常用到。 - 固定取值的属性
还有一种特殊情况,你需要为一个特定的属性提供一个缺省值,并且不希望XML 文件的编写者把你的缺省值替代掉。这时候,就应该使用FIXED关键字,同时为该属性提供一个缺省值。 - 定义缺省值的属性
如果不使用上面任何一种关键字的话,该种属性就是属于这种类型。对于这种属性,你需要在Dtd中为它提供一个缺省值。而在XML文件中可以为该属性给出新的属性值来覆盖事先定义的缺省值,也可以不另外给出属性值,后一种情况下它就默认为采用Dtd中给出的缺省值。
至于究竟采用哪种缺省值,就看实际需要了。下面给出一个具体的例子:
<!ATTLIST 页面作者 姓名 #CDATA #IMPLIED 年龄 #CDATA #IMPLIED 联系信息 #CDATA #REQUIRED 网站职务 #CDATA #FIXED "页面作者" 个人爱好 #CDATA "上网"> |
一个元素可以为以下十种类型中的任意一种:
CDATA Enumerated ID IDREF IDREFS ENTITY ENTITIES NMTOKEN NMTOKENS NOTATION |
下面我们就来一个一个讲述。
CDATA指的是纯文本,即由字符、符号“&”、小于号“<”和引号“"”组成的字符串。当然,就象我们前面讲到的,你应该使用实体&代替“&”,<代替“<”, "代替“"”。
请看下面这个关于剧本的例子:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 剧本 [ <!ELEMENT 剧本 ANY> <!ELEMENT 对话 (#PCDATA)> <!ATTLIST 对话 演员 CDATA> ]> <剧本> <对话 演员="某甲">我可不这么认为!</对话> <对话 演员="某乙">为什么呢?</对话> </剧本> |
属性也可以被描述为一组可接受的取值的列表,XML文件中对属性的赋值将从这个列表中选取一个值。这类属性属于枚举类型ENUMERATED,不过,关键字ENUMERATED是不出现在Dtd定义中的。
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 购物篮 [ <!ELEMENT 购物篮 ANY> <!ELEMENT 肉 EMPTY> <!ATTLIST 肉 类型( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉"> ]> <购物篮> <肉 类型 = "鱼肉"/> <肉 类型 = "牛肉"/> <肉/> </购物篮> |
注意,在上面这个例子中,给属性“类型”定义的缺省值是“鸡肉”,所以“购物篮”中的第三个元素的“类型”属性取值为“鸡肉”。
ID类型
ID是用属性值的方式为文件中的某个元素定义唯一标识的方法,它的作用类似于 HTML文件中的内部链接。在大多数情况下,ID由处理文件的程序或脚本语言使用。
ID的值必须是一个有效的XML名称,它由字母、数字或下划线开始,名字中不能出现空白符。另外一般而言,不要给ID类型的属性事先指定缺省值,这很容易引起不同的元素具有相同的标识的情况,更不能使用FIXED型的缺省值。此类属性经常使用REQUIRED缺省类型,当然,这也不是必须的。有的应用并不要求每个元素都有自己的标识,所以,也可以使用IMPLIED缺省类型。
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人(姓名,EMAIL)> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> <!ATTLIST 联系人 编号 ID #REQUIRED> ]> <联系人列表> <联系人 编号="1"> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> </联系人> <联系人 编号="2"> <姓名>李四</姓名> <EMAIL>li@bbb.org</EMAIL> </联系人> </联系人列表> |
IDREF类型
IDREF类型允许一个元素的属性使用文件中的另一个元素,方法就是把那个元素的 ID标识值作为该属性的取值。例如下面的例子:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人(姓名,EMAIL)> <!ELEMENT 姓名(#PCDATA)> <!ELEMENT EMAIL(#PCDATA)> <!ATTLIST 联系人 编号 ID #REQUIRED> <!ATTLIST 联系人 上司 IDREF #IMPLIED> ]> <联系人列表> <联系人 编号="2"> <姓名>张三</姓名> <EMAIL>zhang@aaa.com</EMAIL> </联系人> <联系人 编号="1" 上司="2"> <姓名>李四</姓名> <EMAIL>li@aaa.com</EMAIL> </联系人> </联系人列表> |
类型NMTOKEN和NMTOKENS是诸多属性类型中面向处理程序的又一个类型。这两个类型用于指示一个有效的名字。当需要把一个元素和其它的元件,例如一个JAVA 类或一个安全算法,相联系时,可以让它们助你一臂之力。请看下面的例子:
关于元素的定义:
<!ELEMENT 数据(#PCDATA)> <!ATTLIST 数据 安全性( ON | OFF ) "OFF" 授权用户 NMTOKENS #IMPLIED > |
XML文件:
<数据 安全性="ON" 授权用户 = "Iggieeb SelenaS Guntherb"> blah blah blah </数据> |
NOTATION类型允许属性值为一个Dtd中声明的符号,这个类型对于使用非XML格式的数据非常有用。
现实世界中存在着很多无法或不易用XML格式组织的数据,例如图象、声音、影象等等。对于这些数据,XML应用程序常常并不提供直接的应用支持。通过为它们设定 NOTATION类型的属性,可以向应用程序指定一个外部的处理程序。例如,当你想要为一个给定的文件类型指定一个演示设备时,可以用NOTATION类型的属性作为触发。
要使用NOTATION类型作为属性的类型,首先要在Dtd中为可选用的记号作出定义。定义的方式有两种,一种是使用MIME类型,形式是:
<!NOTATION 记号名 SYSTEM "MIME类型">
再有一种是使用一个URL路径,指定一个处理程序的路径。
<!NOTATION 记号名 SYSTEM "URL路径名">
在下面这个例子中,为"电影"元素指定了两种可选设备:一种是movPlayer.exe,用来播映.mov文件,另一种则用来绘制GIF图象。
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 文件[ <!ELEMENT 文件 ANY> <!ELEMENT 电影 EMPTY> <!ATTLIST 电影 演示设备 NOTATION ( mp | gif ) #REQUIRED> <!NOTATION mp SYSTEM "movPlayer.exe"> <!NOTATION gif SYSTEM "Image/gif"> ]> <文件> <电影 演示设备 = "mp"/> </文件> |
实体在XML中充当着宏或别名的角色。实体最根本的作用是帮助你为一大段文本创建一个别名,这样,在文件的另一个位置需要引用这段文本时,仅需要指向它的别名就可以了。它还意味着一旦需要修改,仅需要在一个地方作改动,就完成了全局的改动。
我们还提到,实体分为一般实体和参数实体两种类型,它们都可以定义为内部的也可以用关键字SYSTEM定义为外部的。实体的定义必须出现在引用之前,而且要注意正确嵌套,不能出现循环引用的情况。在Dtd中,这两种类型的实体都得到了广泛的应用。
实体属性类型
实体类型的属性值属于一般实体,如前所述,它的定义方式是: <!ENTITY 实体名 "实体内容">
或利用SYSTEM定义外部实体,方式为: <!ENTITY 实体名 SYSTEM "外部文件名">
引用方式为: &实体名;
使用关键字ENTITY,则声明一个属性是实体类型,它的取值为已定义的实体。请看下面例子:
<?xml version = "1.0" encoding="Gb2312" standalone = "yes"?> <!DOCTYPE 文件[ <!ELEMENT 文件 ANY> <!ELEMENT 电影 EMPTY> <!ATTLIST 电影 来源 ENTITY #REQUIRED> <!ENTITY bladeRunner SYSTEM "dvds/bR/br.mov"> ]> <文件> <电影 来源 = "&bladeRunner;"> </文件> |
参数实体参数实体专门用在Dtd中。定义方式是: <!ENTITY % 实体名 "实体内容">
或: <!ENTITY % 实体名 SYSTEM "外部文件名">
引用方式为: %实体名;使用参数实体,可以方便元素和属性的声明。例如:
<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址"> <!ELEMENT 个人联系信息 (%TAG_NAMES; | 生日)> <!ELEMENT 客户联系信息 (%TAG_NAMES; | 公司名)> |
最后提醒大家注意,不要以为实体属性类型的定义与Dtd有关,所以它使用的就是参数实体。参数实体只能在Dtd中使用,而对于任何元素属性值的指定(除了缺省值外),都是在XML文件正文中进行的,因此实体属性值仍属于一般实体。
<!-- CMA ID: 162349 --><!-- Site ID: 10 --><!-- XSLT stylesheet used to transform this file: dw-article-6.0-beta.xsl -->
发表评论
-
设计模式之Visitor模式的应用(二)
2010-12-01 11:43 12821、 回顾 在上一篇文章中,我们给出了一个使用设计模式来改善 ... -
设计模式之Visitor模式的应用(一)
2010-12-01 11:42 11181、介绍 在进行项目的开发活动中,有一些设计在项目刚刚开始工 ... -
XML教程——XML四种解析器的比较
2010-11-26 14:21 10101: DOM DOM 是用与平台 ... -
XML教程——JAXP详解(二)
2010-11-25 19:54 1611在 JAXP 的早期版本中,该首字母缩写代表 Java API ... -
XML教程——JAXP详解(一)
2010-11-25 19:52 1956Java 技术和 XML 无疑是最 ... -
XML教程——XPath实例详解
2010-11-25 19:43 2913如果要告诉别人买一加仑牛奶,您会怎么说?“请去买一加仑牛奶回来 ... -
XML教程——采用DOM来解析XML
2010-11-25 15:35 899DOM基础 在开始使用 DOM ... -
XML教程——采用SAX来解析XML
2010-11-25 15:33 1323什么是 SAX 读取和操纵 XML 文件的标准方法是 DOM ... -
XML教程——XML解析器
2010-11-25 15:30 1647Parser基础 一个 XML Parser ... -
XML教程——XML Schema
2010-11-25 10:22 1232什么是XML Schema XML Schema如同DTD一 ... -
XML教程——XPath
2010-11-25 10:01 1010用XPath精确定位节点元 ... -
XML教程——XSL样式
2010-11-24 20:46 1522什么是样式单 对于一 ... -
XML教程——命名空间
2010-11-24 20:34 1122为何引入名称空间? XML的用途不是单一的。虽然读者可能看到 ... -
XML教程——XML简介
2010-11-24 20:22 967什么是XML XML即为可扩 ...
相关推荐
本教程“XML实用技术教程——顾兵”深入浅出地介绍了XML的基本概念、语法规范以及在实际应用中的技巧。 一、XML基础 1. XML结构:XML文档由元素、属性、文本、注释和处理指令等组成。元素是XML的核心,用于定义...
每个XML文档都包含三部分:声明(Document Type Declaration, DTD)、元素(Elements)和属性(Attributes)。声明部分可选,用于指定文档的版本和是否允许不严格的解析。元素是XML的基石,它们通过开始标签和结束...
使用DTD验证XML文档 一、 DTD的定义: a) DTD是Document Type Defintion的缩写,即文档类型定义。DTD用来描述XML文档的结构。 二、 DTD可能包含的内容: a) 元素的定义规则。 b) 元素之间的关系规则。 c) 属性的定义...
2. **DTD(Document Type Definition)**:DTD是用来定义XML文档结构的规范,它规定了元素的类型、顺序和数量。例如,一个简单的DTD可能定义一个新闻条目的结构,包含标题、日期和内容元素。 3. **命名空间...
本文基于Provost提出的思想,深入探讨了如何将关系数据库理论应用于XML模式和DTD的规范化设计中,提出了具体的算法和方法。 ### XML模式和DTD规范化设计的重要性 XML(Extensible Markup Language)是一种标准的...
经过之前对XML的使用我们发现只要遵守XML的语法规定,编写一个结构良好的XML还是很轻松的,通过引入命名空间也可以为文档中的不同元素进行分组。但是我们之前所做的操作全都是对文档结构的要求,而没有在语法语义上...
综上所述,"JavaEE5实用教程——基于WebLogic和Eclipse程序源代码"涵盖了从基础组件到高级特性的广泛内容,旨在帮助开发者利用JavaEE5的简化特性,结合WebLogic Server的稳定性和Eclipse的高效开发工具,创建高质量...
- **DTD (Document Type Definition)**:一种用于定义XML文档结构的规范,可以包含元素声明、实体声明和属性列表等。 #### 2.5 XML命名空间 - **命名空间**:用于避免元素名称冲突的问题,每个命名空间都有一个...
《XML网页设计实用教程》是一本深入探讨XML技术及其在网页设计中应用的教材。它不仅涵盖了XML的基础概念,还延伸到了与之相关的JSP(JavaServer Pages)和AJAX(Asynchronous JavaScript and XML)技术。这个压缩包...
在"网站建设——XML教程CHM"中,可能涵盖了以下内容: 1. XML基础:解释XML的基本结构、语法和命名规则,包括元素、属性、实体、注释等概念。 2. DTD和XML Schema:介绍如何使用这两种验证工具来定义XML文档的结构...
4. **DTD支持**:除了XML Schema,Xerces-J还支持Document Type Definitions (DTD),这是较早的一种XML验证机制。 5. **Namespace处理**:XML命名空间用于解决同名元素和属性的冲突,Xerces-J能正确处理XML文档中的...
- **DTD(Document Type Definition)**:定义了XML文档的结构和合法元素,类似于XML的“词汇表”。 - **XSD(XML Schema)**:更现代的替代DTD,提供了更强大的数据类型和约束定义能力。 - **XPath**:一种在XML...
鑫编写的《Java Web开发详解——XML+DTD+XML Schema+XSLT+Servlet3.0+JSP2.2深入剖析与实例应用》共分4篇,从XML、XML Schema、XSLT、Servlet、JSP和应用的角度向读者展示了Java Web开发中各种技术的应用,循序渐进...
在XML中,DTD(Document Type Definition)是一种重要的工具,它定义了XML文档的结构和规则,确保XML文档的正确性。DTD约束是XML文档规范的一种方式,它允许我们定义元素、属性以及它们之间的关系,以实现对XML文档...
XML的设计目标是传输和存储数据,而不是显示数据,这与HTML(超文本标记语言)的主要目标——展示内容有所不同。本教程“实战XML教程(第二版)”深入浅出地探讨了XML的各种核心概念和技术,旨在帮助读者掌握XML的全面...
2. DTD与XML Schema:DTD(Document Type Definition)和XML Schema用于定义XML文档的结构和约束。DTD是较早的定义方式,而XML Schema提供更强大、更灵活的数据类型支持。 二、C#解析XML 1. XmlDocument类:C#中,...
6. **文档类型定义(DTD)与XML Schema**:DTD和XML Schema是两种验证XML文档是否符合规范的方法。DTD使用类似XML的语法来定义元素和属性的规则,而XML Schema使用更强大的数据类型系统,提供更精细的结构控制。 7....
本教程将深入探讨C#编程人员如何掌握XML的基本概念和实用技巧。 首先,理解XML的基础是至关重要的。XML是一种结构化的数据表示方式,它使用标签来定义数据的结构和意义。与HTML不同,XML的设计目标是传输和存储数据...
本教程主要针对XML的初级学习者,旨在帮助读者建立起对XML的基本认识和理解。以下将详细阐述XML的一些核心概念和关键知识点: 1. **XML基础语法**:XML文档的结构基于一套严格的规则。每个XML文档必须有一个根元素...
【JAVA初级教程——Web系统开发技术与方法】涵盖了Web编程的多个核心领域,旨在帮助初学者建立起完整的Web系统开发知识体系。以下是对每个知识点的详细解释: 1. **Web编程基本知识**: - **HTML**是超文本标记...