`
liqita
  • 浏览: 292421 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

DTD教程 详细讲解

    博客分类:
  • xml
xml 
阅读更多

DTD(文 档类型定义)的作用是定义 XML 文档的合法构建模块。它使用一系列的合法元素来定义文档结构。也就是说这个文档是定义了XML文档的结构,每个公司都有自己的规范,不然自己的公司内部都 无法读取自己人写的xml文档了。说白了,XML就是文本文档,关键在于用户如何去读取这些文本。

DTD 简介

文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。

DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。

内部的 DOCTYPE 声明

假如 DTD 被包含在您的 XML 源文件中,它应当通过下面的语法包装在一个 DOCTYPE 声明中:

<!DOCTYPE 根元素 [元素声明]>

带有 DTD 的 XML 文档实例(请在 IE5 以及更高的版本打开,并选择查看源代码):

<?xml version="1.0"?>
<!DOCTYPE note [
<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
]>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

在您的浏览器中打开此 XML 文件,并选择“查看源代码”命令

以上 DTD 解释如下:

!DOCTYPE note (第二行)定义此文档是 note 类型的文档。

!ELEMENT note (第三行)定义 note 元素有四个元素:"to、from、heading,、body"

!ELEMENT to (第四行)定义 to 元素为 "#PCDATA" 类型

!ELEMENT from (第五行)定义 frome 元素为 "#PCDATA" 类型

!ELEMENT heading (第六行)定义 heading 元素为 "#PCDATA" 类型

!ELEMENT body (第七行)定义 body 元素为 "#PCDATA" 类型

外部文档声明

假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:

<!DOCTYPE 根元素 SYSTEM "文件名">

这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD: (在 IE5 中打开 ,并选择“查看源代码”命令。)

<?xml version="1.0"?>
<!DOCTYPE note SYSTEM "note.dtd">
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

这是包含 DTD 的 "note.dtd" 文件:

<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>为什么使用 DTD?

通过 DTD,您的每一个 XML 文件均可携带一个有关其自身格式的描述。

通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。

而您的应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。

您还可以使用 DTD 来验证您自身的数据。

一. DTD - 元素

在一个 DTD 中,元素通过元素声明来进行声明。

声明一个元素

在 DTD 中,XML 元素通过元素声明来进行声明。元素声明使用下面的语法:

<!ELEMENT 元素名称 类别>

或者

<!ELEMENT 元素名称 (元素内容)>空元素

空元素通过类别关键词EMPTY进行声明:

<!ELEMENT 元素名称 EMPTY>例子:<!ELEMENT br EMPTY>XML例子:<br />只有 PCDATA 的元素

只有 PCDATA 的元素通过圆括号中的 #PCDATA 进行声明:

<!ELEMENT 元素名称 (#PCDATA)>例子:<!ELEMENT from (#PCDATA)>带有任何内容的元素

通过类别关键词 ANY 声明的元素,可包含任何可解析数据的组合:

<!ELEMENT 元素名称 ANY>例子:<!ELEMENT note ANY>带有子元素(序列)的元素

带有一个或多个子元素的元素通过圆括号中的子元素名进行声明:

<!ELEMENT 元素名称 (子元素名称 1)>

或者

<!ELEMENT 元素名称 (子元素名称 1,子元素名称 2,.....)>例子:<!ELEMENT note (to,from,heading,body)>

当子元素按照由逗号分隔开的序列进行声明时,这些子元素必须按照相同的顺序出现在文档中。在一个完整的声明中,子元素也必须被声明,同时子元素也可拥有子元素。"note" 元素的完整声明是:

<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>声明只出现一次的元素<!ELEMENT 元素名称 (子元素名称)>例子:<!ELEMENT note (message)>

上面的例子声明了:message 子元素必须出现一次,并且必须只在 "note" 元素中出现一次。

声明最少出现一次的元素<!ELEMENT 元素名称 (子元素名称+)>例子:<!ELEMENT note (message+)>

上面的例子中的加号声明了:message 子元素必须在 "note" 元素内出现至少一次。

声明出现零次或多次的元素<!ELEMENT 元素名称 (子元素名称*)>例子:<!ELEMENT note (message*)>

上面的例子中的星号声明了:子元素 message 可在 "note" 元素内出现零次或多次。

声明出现零次或一次的元素<!ELEMENT 元素名称 (子元素名称?)>例子:<!ELEMENT note (message?)>

上面的例子中的问号声明了:子元素 message 可在 "note" 元素内出现零次或一次。

声明“非.../既...”类型的内容例子:<!ELEMENT note (to,from,header,(message|body))>

上面的例子声明了:"note" 元素必须包含 "to" 元素、"from" 元素、"header" 元素,以及非 "message" 元素既 "body" 元素。

声明混合型的内容例子:<!ELEMENT note (#PCDATA|to|from|header|message)*>

上面的例子声明了:"note" 元素可包含出现零次或多次的 PCDATA、"to"、"from"、"header" 或者 "message"。

二. DTD - 属性

在 DTD 中,属性通过 ATTLIST 声明来进行声明。

声明属性

属性声明拥使用下列语法:

<!ATTLIST 元素名称 属性名称 属性类型 默认值>DTD 实例:<!ATTLIST payment type CDATA "check">XML 实例:<payment type="check" />以下是属性类型 的选项: 类型 描述 CDATA 值为字符数据 (character data) (en1|en2|..) 此值是枚举列表中的一个值 ID 值为唯一的 id IDREF 值为另外一个元素的 id IDREFS 值为其他 id 的列表 NMTOKEN 值为合法的 XML 名称 NMTOKENS 值为合法的 XML 名称的列表 ENTITY 值是一个实体 ENTITIES 值是一个实体列表 NOTATION 此值是符号的名称 xml: 值是一个预定义的 XML 值 默认值参数可使用下列值: 解释 属性的默认值 #REQUIRED 属性值是必需的 #IMPLIED 属性不是必需的 #FIXED value 属性值是固定的 规定一个默认的属性值DTD:<!ELEMENT square EMPTY>
<!ATTLIST square width CDATA "0">合法的 XML:<square width="100" />

在上面的例子中,"square" 被定义为带有 CDATA 类型的 "width" 属性的空元素。如果宽度没有被设定,其默认值为0 。

#IMPLIED语法<!ATTLIST 元素名称 属性名称 属性类型 #IMPLIED>例子

DTD:

<!ATTLIST contact fax CDATA #IMPLIED>

合法的 XML:

<contact fax="555-667788" />

合法的 XML:

<contact />

假如您不希望强制作者包含属性,并且您没有默认值选项的话,请使用关键词 #IMPLIED。

#REQUIRED语法<!ATTLIST 元素名称 属性名称 属性类型 #REQUIRED>例子

DTD:

<!ATTLIST person number CDATA #REQUIRED>

合法的 XML:

<person number="5677" />

非法的 XML:

<person />

假如您没有默认值选项,但是仍然希望强制作者提交属性的话,请使用关键词 #REQUIRED。

#FIXED语法<!ATTLIST 元素名称 属性名称 属性类型 #FIXED "value">例子

DTD:

<!ATTLIST sender company CDATA #FIXED "Microsoft">

合法的 XML:

<sender company="Microsoft" />

非法的 XML:

<sender company="W3School" />

如果您希望属性拥有固定的值,并不允许作者改变这个值,请使用 #FIXED 关键词。如果作者使用了不同的值,XML 解析器会返回错误。

列 举属性值语法:<!ATTLIST 元素名称 属性名称 (en1|en2|..) 默认值>DTD 例子:<!ATTLIST payment type (check|cash) "cash">XML 例子:<payment type="check" />

或者

<payment type="cash" />

如果您希望属性值为一系列固定的合法值之一,请使用列举属性值。

三.DTD - 实体

实体是用于定义用于定义引用普通文本或特殊字符的快捷方式的变量。

实体引用是对实体的引用。

实体可在内部或外部进行声明。

一个内部实体声明语法:<!ENTITY 实体名称 "实体的值">例子:

DTD 例子:

<!ENTITY writer "Bill Gates">
<!ENTITY copyright "Copyright W3School.com.cn">

XML 例子:

<author>&writer;&copyright;</author>

注释: 一个实体由三部分构成: 一个和号 (&), 一个实体名称, 以及一个分号 (;)。

一个外部实体声明语法:<!ENTITY 实体名称 SYSTEM "URI/URL">例子:

DTD 例子:

<!ENTITY writer SYSTEM "http://www.w3school.com.cn/dtd/entities.dtd">
<!ENTITY copyright SYSTEM "http://www.w3school.com.cn/dtd/entities.dtd">

XML 例子:

<author>&writer;&copyright;</author>

四. DTD - 来自网络的实例

电视节目表 DTD

由 David Moisan 创造。拷贝自:http://www.davidmoisan.org/

<!DOCTYPE TVSCHEDULE [

<!ELEMENT TVSCHEDULE (CHANNEL+)>
<!ELEMENT CHANNEL (BANNER,DAY+)>
<!ELEMENT BANNER (#PCDATA)>
<!ELEMENT DAY (DATE,(HOLIDAY|PROGRAMSLOT+)+)>
<!ELEMENT HOLIDAY (#PCDATA)>
<!ELEMENT DATE (#PCDATA)>
<!ELEMENT PROGRAMSLOT (TIME,TITLE,DESCRIPTION?)>
<!ELEMENT TIME (#PCDATA)>
<!ELEMENT TITLE (#PCDATA)>
<!ELEMENT DESCRIPTION (#PCDATA)>

<!ATTLIST TVSCHEDULE NAME CDATA #REQUIRED>
<!ATTLIST CHANNEL CHAN CDATA #REQUIRED>
<!ATTLIST PROGRAMSLOT VTR CDATA #IMPLIED>
<!ATTLIST TITLE RATING CDATA #IMPLIED>
<!ATTLIST TITLE LANGUAGE CDATA #IMPLIED>

]>报纸文章 DTD

拷贝自:http://www.vervet.com/

<!DOCTYPE NEWSPAPER [

<!ELEMENT NEWSPAPER (ARTICLE+)>
<!ELEMENT ARTICLE (HEADLINE,BYLINE,LEAD,BODY,NOTES)>
<!ELEMENT HEADLINE (#PCDATA)>
<!ELEMENT BYLINE (#PCDATA)>
<!ELEMENT LEAD (#PCDATA)>
<!ELEMENT BODY (#PCDATA)>
<!ELEMENT NOTES (#PCDATA)>

<!ATTLIST ARTICLE AUTHOR CDATA #REQUIRED>
<!ATTLIST ARTICLE EDITOR CDATA #IMPLIED>
<!ATTLIST ARTICLE DATE CDATA #IMPLIED>
<!ATTLIST ARTICLE EDITION CDATA #IMPLIED>

<!ENTITY NEWSPAPER "Vervet Logic Times">
<!ENTITY PUBLISHER "Vervet Logic Press">
<!ENTITY COPYRIGHT "Copyright 1998 Vervet Logic Press">

]>产品目录 DTD

拷贝自:http://www.vervet.com/

<!DOCTYPE CATALOG [

<!ENTITY AUTHOR "John Doe">
<!ENTITY COMPANY "JD Power Tools, Inc.">
<!ENTITY EMAIL "jd@jd-tools.com">

<!ELEMENT CATALOG (PRODUCT+)>

<!ELEMENT PRODUCT
(SPECIFICATIONS+,OPTIONS?,PRICE+,NOTES?)>
<!ATTLIST PRODUCT
NAME CDATA #IMPLIED
CATEGORY (HandTool|Table|Shop-Professional) "HandTool"
PARTNUM CDATA #IMPLIED
PLANT (Pittsburgh|Milwaukee|Chicago) "Chicago"
INVENTORY (InStock|Backordered|Discontinued) "InStock">

<!ELEMENT SPECIFICATIONS (#PCDATA)>
<!ATTLIST SPECIFICATIONS
WEIGHT CDATA #IMPLIED
POWER CDATA #IMPLIED>

<!ELEMENT OPTIONS (#PCDATA)>
<!ATTLIST OPTIONS
FINISH (Metal|Polished|Matte) "Matte"
ADAPTER (Included|Optional|NotApplicable) "Included"
CASE (HardShell|Soft|NotApplicable) "HardShell">

<!ELEMENT PRICE (#PCDATA)>
<!ATTLIST PRICE
MSRP CDATA #IMPLIED
WHOLESALE CDATA #IMPLIED
STREET CDATA #IMPLIED
SHIPPING CDATA #IMPLIED>

<!ELEMENT NOTES (#PCDATA)>

]>

五.DTD - XML 构建模块

XML 以及 HTML 文档的主要构建模块是类似 <body>....</body> 这样的标签。

XML 文档构建模块

所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

  • 元素
  • 属性
  • 实体
  • PCDATA
  • CDATA

下面是每个构建模块的简要描述。

元素

元素是 XML 以及 HTML 文档的主要构建模块

HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

实例:<body>body text in between</body>
<message>some message in between</message>属性

属性可提供有关元素的额外信息

属性总是被置于某元素的开始标签中。属性总是以名称/值 的形式成对出现的。下面的 "img" 元素拥有关于源文件的额外信息:

<img src="computer.gif" />

元素的名称是 "img"。属性的名称是 "src"。属性的值是 "computer.gif"。由于元素本身为空,它被一个 " /" 关闭。

实体

实体是用来定义普通文本的变量。实体引用是对实体的引用。

大多数同学都了解这个 HTML 实体引用:"&nbsp;"。这个“无折行空格”实体在 HTML 中被用于在某个文档中插入一个额外的空格。

当文档被 XML 解析器解析时,实体就会被展开。

下 面的实体在 XML 中被预定义: 实体引用 字符 &lt; < &gt; > &amp; & &quot; " &apos; ' PCDATA

PCDATA 的意思是被解析的字符数据(parsed character data)。

可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。

PDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。

文本中的标签会被当作标记来处理,而实体会被展开。

不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &amp;、&lt; 以及 &gt; 实体来分别替换它们。

CDATA

CDATA 的意思是字符数据(character data)。

CDATA 是不会被解析器解析的文本。 在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。

 

分享到:
评论

相关推荐

    DTD教程实例

    本教程集成了详细的DTD知识讲解与实例,是XML开发者不可多得的学习资源。 XML(eXtensible Markup Language)是一种自定义标记语言,广泛应用于数据交换、存储和呈现。而DTD则是XML的基石之一,它提供了一种机制来...

    xml中DTD的深入讲解

    本篇将深入讲解XML中的DTD(Document Type Definition),这是对XML文档结构的一种规范,确保了数据的一致性和有效性。 1. **XML概述** - **使用XML的原因**:XML的诞生是为了克服HTML在数据交换和存储中的局限性...

    DTD(XML文档类型定义)教程

    本教程旨在深入讲解DTD的概念、编写方式、使用方法,以及它与XML Schema的区别和联系。 XML的核心在于提供了一种自定义标记的方式,使得数据不仅具有良好的可读性,而且能表达出数据间的逻辑关系,便于搜索和处理。...

    2022年用FileStreams将DTD插入XML中Java教程.docx

    本教程重点讲解如何在2022年使用Java的FileStreams操作XML文件并插入DTD。以下是详细步骤: 1. **创建DataSet Schema** 首先,你需要创建一个基于DTD的DataSet Schema。这可以通过Visual Studio .NET的Visual Data...

    DTD教程

    现在,你可以通过下载提供的“DTD教程.DOC”文件,进一步深入学习。这份文档将详细讲解各个知识点,通过实例解析,帮助你更好地掌握和运用DTD。记住,实践是检验真理的唯一标准,动手编写和验证自己的DTD,将使你的...

    实战XML教程(第二版),对xml的知识做了深入细致的讲解。

    3. XML Schema和DTD:详细讲解它们的创建和应用。 4. XSLT和XPath:实践如何使用它们进行数据转换和选取。 5. 实际案例:结合具体项目,展示XML在实际工作中的应用。 6. XML的安全性与最佳实践:讨论XML注入攻击及...

    mybatis 教程讲解

    ### MyBatis教程详解 #### 一、MyBatis简介 MyBatis 是一款优秀的持久层框架,它支持 SQL 查询、存储过程以及高级映射功能。通过使用简单的 XML 或注解进行配置和原始映射,MyBatis 可以帮助开发者实现 Java 接口...

    EXTJS4.0 教程实例~讲解

    ### EXTJS4.0 教程实例~讲解 #### 知识点一:EXTJS4.0 中 Window 组件的创建与配置 **知识点概述**: EXTJS4.0 是一款用于构建现代化 Web 应用的强大框架。在该版本中,创建组件的方式有所更新,引入了 `Ext....

    w3cshool文档使用教程

    教程将涵盖XML的基本语法、命名空间、DTD(Document Type Definition)或XSD(XML Schema Definition)的使用,以及XPath和XSLT等处理XML的工具和技术。 3. **浏览器脚本系列教程**:主要包括JavaScript和jQuery两...

    XML实用教程word版

    本"XML实用教程Word版"将详细讲解以上内容,帮助读者从基础到实践,全面掌握XML的相关知识。CHM版教程可能包含了练习题、示例代码和详细的解答,方便学习者进行自我检测和深入研究。通过学习本教程,你将能够熟练...

    XML IBM教程 v01

    - **XML Schema的引入**:详细阐述XML Schema的原理,比较其与DTD的区别,突出XML Schema的优势所在。 - **相关技术介绍**:深入探讨XML Namespaces、XPath、XSL和XSLT等技术的应用场景与实现方法。 #### 四、目标...

    w3schoolWeb全套教程.chm

    教程将讲解XML的基本语法、命名空间、DTD(文档类型定义)和XSLT(XML样式表转换)等概念。 5. DOM(Document Object Model):DOM是HTML和XML文档的编程接口,它将文档表示为树形结构,使得可以通过JavaScript或...

    完整版W3CSchool线下教程_完整版W3CSchool线下教程.chm_

    教程将介绍XML的基本结构、命名规则、文档类型定义(DTD)、XML Schema,以及如何解析和验证XML文档。此外,还会涉及到XPath、XSLT等处理XML数据的技术,让开发者能更好地管理和操作XML数据。 **CSS教程** CSS...

    尚硅谷Mybatis视频教程1-10

    6.《尚硅谷_MyBatis_全局配置文件_引入dtd约束.avi》讲解了Mybatis的全局配置文件(mybatis-config.xml)的结构和作用,包括引入DTD约束,确保配置文件的语法正确。 8.《尚硅谷_MyBatis_全局配置文件_settings_运行...

    w3school在线教程

    同时,教程还会涉及XML Schema和DTD(文档类型定义),它们是验证XML文档结构的重要工具。XML与XSLT、XPath等技术的结合使用也会有所讲解。 **JavaScript教程** JavaScript是一种轻量级的脚本语言,广泛应用于...

    w3cschoo全面的离线教程

    在【HTML】部分,教程会详细介绍超文本标记语言(HTML)的基础知识,包括标签、属性、结构元素如头部、主体和尾部,以及如何创建链接、图像、表格和表单。此外,还会涉及更高级的概念,如框架集、CSS样式内联、内部...

    DOM4J帮助文档及使用教程

    7. **XPath支持**:DOM4J支持XPath表达式,教程会讲解如何使用XPath快速定位XML文档中的特定节点。 8. **事件处理**:如果需要在解析或操作XML时执行某些动作,可以注册监听器或处理器,DOM4J提供了相应的API。 9....

    w3school网页设计教程

    w3school的JavaScript教程涵盖变量、数据类型、运算符、控制流程、函数等基础概念,还深入讲解DOM操作、事件处理、Ajax异步通信,以及现代JavaScript特性,如ES6的箭头函数和Promise。 XML(eXtensible Markup ...

    xml实用技术教程—— 顾兵

    XML(eXtensible Markup Language)是一种用于标记数据的语言,由W3C组织制定...本教程“XML实用技术教程——顾兵”将详细讲解这些知识点,并通过实例演示如何在实践中运用XML,帮助读者掌握XML的精髓,提升开发能力。

    XML网页技术实用教程

    接着,教程会介绍XML的DTD(Document Type Definition)和XML Schema,它们是XML文档的结构定义工具,用来规定文档的合法结构和数据类型,确保数据的有效性和一致性。 此外,教程还会讲解XPath,一种在XML文档中...

Global site tag (gtag.js) - Google Analytics