DTD的定义规则和编写

mamacmm

浏览: 201887 次
性别:
来自: 河北

最近访客更多访客>>

壹亻憔悴

会飞的大鳄

大白菜鸡毛菜油麦菜

junheihuan

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

J2EE

XML 数据结构 HTML

1．DTD - XML 建立主组件群（blocks）
像<body>....</body>之类的标签是XML和HTML文件的主组件群（blocks）。

1.1XML文件的组件群
从DTD来看，所有的XML文件（和HTML文件）都是由接下来的简单组件群组成的：Elements元素；Attributes 属性；Entities实体；PCDATA 被解析的字符数据（Parsed Character Data）；CDATA 字符数据值（Character Data）。下面是每个组件群的简短解释。

1.2元素（Elements）
元素是XML和HTML文件的主组件群（main building blocks）。HTML元素的实例是"body" 和"table"。XML元素实例是"note" 和"message"。元素可以包括文本、其它元素或者空值。空值html元素的实例是"hr", "br" 和"img"。
例如：
<body>body text in between</body>
<message>some message in between</message>

1.3属性（Attributes）
属性提供关于元素的额外信息（extra information about elements）。属性总是置于元素的开始标签里面。属性一般是以“名称（name）/值（value）”这样的形势一对对的出现。下面的“img”元素就是关于源文件的补充信息：
<img src="computer.gif" />
元素名称是“img”。属性名称“src”。属性值是"computer.gif"。因为元素自身是空值，所以它是以“/”结束的。

1.4实体（Entities）
实体是对于定义普通文件（define common text）的变量。实体参数是定义实体的参数。很多人都知道HTML实体参数：" "。这里的"no-breaking-space"实体是在HTML中用来在文本中插入一个额外空间的。当XML剖析器解析文件时，实体就会得到扩展。下面（表1）的实体是在XML中预定的：

表 1
字符	字符实体
&	&或&
'	'或'
>	>或>
<	<或<
"	"或"

1.5 PCDATA
PCDATA的意思是被解析的字符数据。把字符数据当作XML元素的开始标签与结束标签之间的文本。剖析器会分析PCDATA文本。文本中的标签会被当作标示的字体，实体将会扩展。

1.6 CDATA
CDATA也是字符数据的意思。剖析器不会解析CDATA文本。文本中的标签不会作为标示字体，实体也将不会得到扩展。

2．元素定义
2.1元素声明
元素声明语法如下：
<!ELEMENT name content>
其中，name是一个标准的XML标记的名字。Centent由以下三种之一组成：
①关键字EMPTY；
②关键字ANY；
③描述包含在本元素中的子元素的顺序和重复次数的内容模型。

2.2元素内容类型（Element Content Model）
元素内容通常有五种类型：EMPTY、ANY、#PCDATA、子元素型和混合型。

2.2.1 EMPTY类型
EMPTY用于定义空元素，该元素只可能有属性而不会有字符数据或子元素。其形式为<swt/>或<swt></swt>。声明空元素的语法如下：
<!ELEMENT emptyelement EMPTY>

2.2.2 ANY类型
该元素可以包含DTD中定义的其他任何元素或已编译的字符数据。声明该元素的语法如下：
<!ELEMENT anyelement ANY>

2.2.3 #PCDATA类型
不包含其它任何元素而只包含字符数据的元素，用关键字#PCDATA进行定义，它代表“已编译的字符数据（parsed character data）”。PCDATA可以包含除标记以外的一切字符，包括数字、字母和符号等。被定义为包含PCDATA的元素不能包含任何其它子元素。示例如下：
<!ELEMENT title(#PCDATA)>

2.2.4 子元素类型
    元素可以包含一系列的子元素，子元素内容模型用于指定某个元素可以包含哪些子元素，如：
<!ELEMENT message(header,body,signature,footer)>//message元素包含四个子元素，依次是header、body、signature和footer元素。
    根据子元素间的关系，子元素内容模型可以有两种可能的结构：序列和选择。
①序列。其所有子元素必须出现且仅出现一次，这种结果成为序列。使用序列时应注意，首先，序列中不能出现#PCDATA；其次，子元素自身还可以包含其它子元素。
②选择。元素间的选择可以进行如下声明：
<!ELEMENT elem(subelem1|subelem2|subelem3)>//将子元素用竖线进行分隔，表明elem元素的子元素为subelem1、subelem2和subelem3三者之一，但不能同时包含其中的两个或三个子元素。
    序列和选择这两种结构可以结合使用。

2.2.5 混合类型
若某元素既包含子元素又包含已编译的字符数据，则该元素具有混合内容。其声明如下：
<!ELEMENT pick(#PCDATA|one|two|three)*>
为避免产生错误，混合内容元素的声明必须遵循这一格式。即采用单一的一组可选项，以#PCDATA开始，后面是混合内容中可能出现的子元素类型，每种只需声明一次。除此之外，“*”必须放在右括号之后。下面的声明是错误的：
<!ELEMENT pick(one|#PCDATA|two*|three)>

2.3元素出现次数指示符（Element Occurrence Indicator）见表2

表 2
符号	代表标记出现的次数
？	不出现或只出现一次
*	不出现或可出现多次
+	必须出现一次以上
无符号	只能出现一次

3．属性定义
3.1属性声明
属性声明的语法如下：
<!ATTLIST Element_name Attribute_name Type Defualt_value>
其中，ATTLIST关键字用来定义元素所具有的属性，Element_name是元素名，Attribute_name是该元素所具有的属性名，Type是属性的类型，Defualt_value是属性的默认值。注意：在一个给定的元素中不能有两个属性同名；若属性值中含有双撇号，则该属性值应用单撇号括起来。如：
<job comments=’He said,”I can paint only red door” ’>Door Painter</job>

3.2 属性类型
在XML中共有10种属性类型(attribute-type)：（见表3）

表 3
属性值类别	描述
CDATA	属性值仅仅是一般的文字。与#PCDATA元素声明类似。 <!ATTLIST AnElem attr CDATA #REQUIRED>
Enumerated	列出该属性的取值范围，一次只能有一个属性值能够赋予属性。 <!ATTLIST play position (center\|forward\|defense) ”center”>
NMTOKEN	表示属性值只能由字母或下划线_开始，之后是字母、数字、下划线、短横线或圆点，且不能含有空格。
NMTOKENS	表示属性值能够由多个nmtoken组成，每个nmtoken之间用空格隔开。
ID	ID类型用于标识文档中的元素。该属性在xml文件中是唯一的。同时，每个元素最多只能具有一个ID类型的属性。 <!ALLTIST author authorID ID #REQUIRED >
IDREF/ IDREFS	IDREF表示该属性值是参考了另一个id属性；IDREFS表示该属性值是参考了多个id属性，这些id属性的值用空格隔开。 DTD定义： <!ELEMENT bookInfo(publishers,authors,books)> <!ELEMENT publishers(publisher+)> <!ELEMENT publisher(pname,address)> <!ATTLIST publisher publisherID ID #REQUIRED> <!ELEMENT pname(#PCDATA)> <!ELEMENT address(#PCDATA)> <!ELEMENT authors(author+)> <!ELEMENT author(aname,age,sex)> <!ATTLIST author authorID ID #REQUIRED> <!ELEMENT aname(#PCDATA)> <!ELEMENT age(#PCDATA)> <!ELEMENT sex(#PCDATA)> <!ELEMENT books(book*)> <!ELEMENT book(title,price,year)> <!ATTLIST book publisher IDREF #REQUIRED author IDREFS #REQUIRED> <!ELEMENT title(#PCDATA)> <!ELEMENT price(#PCDATA)> <!ELEMENT year(#PCDATA)> 对应的XML文档： <bookInfo> <publishers> <publisher publisherID=”p001”> <pname>tsinghua university press</pname> <address>Beijing</address> </publisher> <publisher publisherID=”p002”> <pname>electronic industy press</pname> <address>Beijing</address> </publisher> </publishers> <authors> <author authorID=”a001”> <aname>Mary</aname> <age>34</age> <sex>male</sex> </author> <author authored=”a002”> <aname>Tom</aname> <age>39</age> <sex>female</sex> </author> </authors> <books> <book publisher=”p001” author=”a001 a002”> <title>XML</title> <price>22</price> <year>2007</year> </book> </books> </bookInfo>
ENTITY	表示该属性的设定值是一个外部实体（entity），如一个图片文件。
ENTITYS	该属性值包含了多个外部entity，不同的entity之间用空格隔开。
NOTATION	属性值是在DTD中声明过的notation（声明用什么应用软件解读某些二进制文件，如图片）。 <!NOTATION gif SYSTEM “GIF_Viewer”> <!NOTATION jpg SYSTEM “JPG_Viewer”> <!NOTATION png SYSTEM “PNG_Viewer”> <!ELEMENT img （#PCDATA）> <!ATTLIST img src CDATA #REQUIRED NOTATION（png\|jpg\|gif）#REQUIRED > //其中，type属性的值可以为png、jpg和gif之一，且每个值均与一个相应的<!NOTATION>声明相对应。

3.3 属性默认值
属性声明可以给属性指定一个默认值，使得当在XML文档中未明确地指定该属性的值时，XML处理器会将此默认值作为该属性的值。属性的默认值可用#REQUIRED、#IMPLIED、#FIXED和字符串定义，见表4。

表4
属性内定值	描述
#REQUIRED	表示在标记中必须出现此属性。
#IMPLIED	标记中可以不出现此属性。即该属性不是必须使用。
#FIXED	属性的值是固定的某个值。
字符串	标记中如没有指定属性的值，那么此字符串就是此属性的值。

示例：
①属性值为字符数据，默认值为numeric，在未指定其他值时使用该值。
<!ELEMENT year （#PCDATA）>
<!ATTLIST year format CDATA “numeric”>
②属性有一默认值numeric，并且必须使用该值作为属性的值。
<!ELEMENT year （#PCDATA）>
<!ATTLIST year format CDATA #FIXED “numeric”>
③属性无默认值，但它必须出现在year元素中。
<!ELEMENT year （#PCDATA）>
<!ATTLIST year format CDATA #REQUIRED>
④属性值为numeric或character，而numeric为默认值。
<!ELEMENT year （#PCDATA）>
<!ATTLIST year format (numeric|character) ”numeric”>
⑤属性值为numeric或character，在此处numeric被固定为唯一的实际值。
<!ELEMENT year （#PCDATA）>
<!ATTLIST year format (numeric|character) #FIXED”numeric”>
⑥属性必须有一个值，numeric或character。
<!ELEMENT year （#PCDATA）>
<!ATTL

分享到：

产生验证码图片 | 严重: Unable to find parent packages str ...

2009-08-19 11:19
浏览 2359
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

《数据结构》（02331）基础概念: 内容概要：本文档《数据结构》（02331）第一章主要介绍数据结构的基础概念，涵盖数据与数据元素的定义及其特性，详细阐述了数据结构的三大要素：逻辑结构、存储结构和数据运算。逻辑结构分为线性结构（如线性表、栈、队列）、树形结构（涉及根节点、父节点、子节点等术语）和其他结构。存储结构对比了顺序存储和链式存储的特点，包括访问方式、插入删除操作的时间复杂度以及空间分配方式，并介绍了索引存储和散列存储的概念。最后讲解了抽象数据类型（ADT）的定义及其组成部分，并探讨了算法分析中的时间复杂度计算方法。适合人群：计算机相关专业学生或初学者，对数据结构有一定兴趣并希望系统学习其基础知识的人群。使用场景及目标：①理解数据结构的基本概念，掌握逻辑结构和存储结构的区别与联系；②熟悉不同存储方式的特点及应用场景；③学会分析简单算法的时间复杂度，为后续深入学习打下坚实基础。阅读建议：本章节内容较为理论化，建议结合实际案例进行理解，尤其是对于逻辑结构和存储结构的理解要深入到具体的应用场景中，同时可以尝试编写一些简单的程序来加深对抽象数据类型的认识。

【工业自动化】施耐德M580 PLC系统架构详解：存储结构、硬件配置与冗余设计: 内容概要：本文详细介绍了施耐德M580系列PLC的存储结构、系统硬件架构、上电写入程序及CPU冗余特性。在存储结构方面，涵盖拓扑寻址、Device DDT远程寻址以及寄存器寻址三种方式，详细解释了不同类型的寻址方法及其应用场景。系统硬件架构部分，阐述了最小系统的构建要素，包括CPU、机架和模块的选择与配置，并介绍了常见的系统拓扑结构，如简单的机架间拓扑和远程子站以太网菊花链等。上电写入程序环节，说明了通过USB和以太网两种接口进行程序下载的具体步骤，特别是针对初次下载时IP地址的设置方法。最后，CPU冗余部分重点描述了热备功能的实现机制，包括IP通讯地址配置和热备拓扑结构。适合人群：从事工业自动化领域工作的技术人员，特别是对PLC编程及系统集成有一定了解的工程师。使用场景及目标：①帮助工程师理解施耐德M580系列PLC的寻址机制，以便更好地进行模块配置和编程；②指导工程师完成最小系统的搭建，优化系统拓扑结构的设计；③提供详细的上电写入程序指南，确保程序下载顺利进行；④解释CPU冗余的实现方式，提高系统的稳定性和可靠性。其他说明：文中还涉及一些特殊模块的功能介绍，如定时器事件和Modbus串口通讯模块，这些内容有助于用户深入了解M580系列PLC的高级应用。此外，附录部分提供了远程子站和热备冗余系统的实物图片，便于用户直观理解相关概念。

某型自动垂直提升仓储系统方案论证及关键零部件的设计.zip: 某型自动垂直提升仓储系统方案论证及关键零部件的设计.zip

2135D3F1EFA99CB590678658F575DB23.pdf#page=1&view=fitH: 2135D3F1EFA99CB590678658F575DB23.pdf#page=1&view=fitH

agentransack文本搜索软件: 可以搜索文本内的内容，指定目录，指定文件格式，匹配大小写等

Windows 平台 Android Studio 下载与安装指南.zip: Windows 平台 Android Studio 下载与安装指南.zip

Android Studio Meerkat 2024.3.1 Patch 1（android-studio-2024.3.1.14-windows-zip.zip.002): Android Studio Meerkat 2024.3.1 Patch 1（android-studio-2024.3.1.14-windows.zip）适用于Windows系统，文件使用360压缩软件分割成两个压缩包，必须一起下载使用： part1: https://download.csdn.net/download/weixin_43800734/90557033 part2: https://download.csdn.net/download/weixin_43800734/90557035

4-3-台区智能融合终端功能模块技术规范（试行）.pdf: 国网台区终端最新规范

4-13-台区智能融合终端软件检测规范（试行）.pdf: 国网台区终端最新规范

【锂电池剩余寿命预测】Transformer-GRU锂电池剩余寿命预测（Matlab完整源码和数据）: 1.【锂电池剩余寿命预测】Transformer-GRU锂电池剩余寿命预测（Matlab完整源码和数据） 2.数据集：NASA数据集，已经处理好，B0005电池训练、B0006测试； 3.环境准备：Matlab2023b，可读性强； 4.模型描述：Transformer-GRU在各种各样的问题上表现非常出色，现在被广泛使用。 5.领域描述：近年来，随着锂离子电池的能量密度、功率密度逐渐提升，其安全性能与剩余使用寿命预测变得愈发重要。本代码实现了Transformer-GRU在该领域的应用。 6.作者介绍：机器学习之心，博客专家认证，机器学习领域创作者，2023博客之星TOP50，主做机器学习和深度学习时序、回归、分类、聚类和降维等程序设计和案例分析，文章底部有博主联系方式。从事Matlab、Python算法仿真工作8年，更多仿真源码、数据集定制私信。

基于android的家庭收纳App的设计与实现.zip: Android项目原生java语言课程设计，包含LW+ppt

大学生入门前端-五子棋vue项目: 大学生入门前端-五子棋vue项目

二手车分析完整项目，包含源代码和数据集，包含：XGBoost 模型，训练模型代码，数据集包含 10,000 条二手车记录的数据集，涵盖车辆品牌、型号、年份、里程数、发动机缸数、价格等: 这是一个完整的端到端解决方案，用于分析和预测阿联酋（UAE）地区的二手车价格。数据集包含 10,000 条二手车信息，覆盖了迪拜、阿布扎比和沙迦等城市，并提供了精确的地理位置数据。此外，项目还包括一个基于 Dash 构建的 Web 应用程序代码和一个训练好的 XGBoost 模型，帮助用户探索区域市场趋势、预测车价以及可视化地理空间洞察。数据集内容项目文件以压缩 ZIP 归档形式提供，包含以下内容：数据文件： data/uae_used_cars_10k.csv：包含 10,000 条二手车记录的数据集，涵盖车辆品牌、型号、年份、里程数、发动机缸数、价格、变速箱类型、燃料类型、颜色、描述以及销售地点（如迪拜、阿布扎比、沙迦）。模型文件： models/stacking_model.pkl：训练好的 XGBoost 模型，用于预测二手车价格。 models/scaler.pkl：用于数据预处理的缩放器。 models.py：模型相关功能的实现。 train_model.py：训练模型的脚本。 Web 应用程序文件： app.py：Dash 应用程序的主文件。 callback

《基于YOLOv8的船舶航行违规并线预警系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

《基于YOLOv8的工业布匹瑕疵分类系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

CodeCount.exe: 此为代码审查工具可查文件数，字节数，总行数，代码行数，注释行数，空白行数，注释率等

商业数据分析与Python实现：企业破产概率及抽样技术解析（复现论文或解答问题，含详细可运行代码及解释）: 内容概要：本文档涵盖了一项关于企业破产概率的详细分析任务，分为书面回答和Python代码实现两大部分。第一部分涉及对业务类型和破产状态的边际分布、条件分布及相对风险的计算，并绘制了相应的二维条形图。第二部分利用Python进行了数据处理和可视化，包括计算比值比、识别抽样技术类型、分析鱼类数据集以及探讨辛普森悖论。此外，还提供了针对鱼类和树木数据的统计分析方法。适合人群：适用于有一定数学和编程基础的学习者，尤其是对统计学、数据分析感兴趣的大学生或研究人员。使用场景及目标：①帮助学生掌握统计学概念如边际分布、条件分布、相对风险和比值比的实际应用；②教授如何用Python进行数据清洗、分析和可视化；③提高对不同类型抽样技术和潜在偏见的理解。其他说明：文档不仅包含了理论知识讲解，还有具体的代码实例供读者参考实践。同时提醒读者在完成作业时需要注意提交格式的要求。

MCP快速入门实战，详细的实战教程: MCP快速入门实战，详细的实战教程

python，playwright基础: python，playwright基础

氖星生命体SDK1.8: 氖星生命体SDK是JAVA开发的代码。它能输出多种情绪和意图，让机器人、AI玩具和其他硬件具备人工生命，并在意图驱动下运行。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论