一 XML 文档的结构
XML 文档是由一组使用唯一名称的实体组成。所有的文档都以根或实体开始,而且所有
的实体都是可选的。实体可以被看作更复杂功能的别名。单个实体的名称可以代替许多
文本。在实体中,每当需要引用某个文本时,只需要使用实体,处理器就会展开实体的
内容。
XML文档是一种逻辑结构。逻辑上,文档的组成部分包括声明、元素、注释、字符引用和
处理指令(在文档中使用显示标记表示)如下:
<?xml version="1.0" encoding="UTF-8"?> --XML声明
<!DOCTYPE class SYSTEM "test.dtd"
[
<!ENTITY name "成龙"> --文档类型定义
]
>
<class> --根元素
<student> --子元素
<name>张三</name> --叶子元素
</student>
</class>
注意在XML中元素的字符区分大小写。
二 创建XML文档
XML文档始终都是以一个声明开始,这个声明指定该文档遵循XML 1.0 的规范。
构建一个XML文档的步骤如下:
(1)XML的声明
这个声明很简单,位于XML文档的第一行
XML声明语法如下:
<?xml version="1.0"?>
XML的声明是处理指令,告诉处理解析器该文档已经标记为XML文档,以及如何处理文档
中的数据。包括XML声明在内的所有处理指令都以"<?"开始,以"?>"结束。"<?"后面是
处理指令的名称,即"xml"。XML处理指令要指定一个version属性,并允许指定可选的
standalone和encoding属性。xml声明至少应有保留名称xml以及一个版本号属性,只有
版本号是必须的。encoding 和 standalone可有可无。
<?xml version="1.0" standalone="no" encoding="UTF-8"?>
standalone 属性可以设置为yes|no.yes指定不使用外部声明,而no表示将引用外部声
明
所有XML解析器都必须支持与ACSII相应的8位或16位Unicode编码。"encoding="UTF-
8""指定用户使用的字符编码。UTF-8与8位ACSII字符相对应。而GB2312和GBK与中文字
符集相对应。
(2)创建根元素
在XML里根元素只有一个,用于描述文档的作用。每个XML文档都有一个根元素。
<?xml version="1.0" standalone="no" encoding="UTF-8"?>
<class></class>
(3)创建XML代码
要创建代码,根据应用需要创建自定义元素和属性。元素包括标签和内容
<name>张三</name>
标签包括尖括号及尖括号中的文本
XML文档是由数据以及描述该数据的标记组成。数据通常是字符数据,也可以是二进制数
据。而标记包括标签、注释、处理指令、DTD和引用等。
注释语法
<!--注释内容-->
使用注释应注意以下几点:
(1) 注释内容中不应包含“-”或“—”,因为可能会使XML解析器产生混淆。
(2) 注释绝对不能放在标签中。下面是错误用法
<name <!--姓名-->>张三</name>
(3) 注释不能放在实体声明中,也不能放在xml声明只前。XML声明必须始终放在第一
行。
(4) 注释可用于注释标签集。
<!--
<name>TOM</name>
<age>20</age>
<sex>男</sex>
(5) 注释不能嵌套使用。
三 标签间的字符数据的分类
在XML中标签间的文本数据可以是任意类型。但除了“<"字符,因为"<"预留做标签的开
始字符。
字符数据可分为两类:
PCDATA
CDATA
1.PCDATA 表示已解析的字符数据。字符数据可被看作XML元素的内容。PCDATA是要通过
解析器进行解析的文本。文本中的标签将被看作为标记,实体将会扩展。
2.CDATA 指字符数据。CDATA是不通过解析器进行解析的文本,文本中的标签将不被看
作为标记,实体不会扩展。在CDATA块中,XML解析器会忽略所有标签和实体引用
四 实体
实体是XML的存储单元。实体可以包含常用的短语、键盘字符、文件、数据库记录或任何
包含数据的项。
在文档中使用实体可以避免重复输入相同的内容。可以将一个实体与文本关联。每当需
要在文档中使用文本,就使用实体名来引用。
在XML中,有些字符(如< > 或&)可以放在文本中,但不能以字面格式存在,否则会解
析错误。
XML中一些预定义的字符实体集,可以用于取代字符的字面格式。
实体名称 字符
< <
> >
& &
" "
' '
使用实体引用将实体插入XML文档中。解析器遇到实体引用时,会将实体替换为实体的内
容。
实体分为两类:
一般实体
参数实体
1.一般实体 可以在XML文档中的任何位置出现的实体称为一般实体,一般实体可以声明
为内部实体和外部实体。内部实体仅存在于声明它们的文档中,外部实体则指文档外的
存储。
内部实体如下:
<!ENTITY entity_name "value">
上面实体是一个内部实体
外部实体使用一个标识符爱指向外部文件。外部实体标识符分为两种类型,SYSTEM(系统
)和PUBLIC(公共)。前者用于引用本地计算机(或网络),后者用于引用公共计算机
(或网络)。
外部实体如下
<!ENTITY entity_name SYSTEM|PUBLIC "value">
引用实体语法:
&entity_name;
引用实体因该注意:
(1)引用实体前,必须现在XML文档中声明该实体。
(2)实体引用不应包含有任何空格。例如,"& test;"或"&test ;"将导致错误。
(3)实体引用的文本必须是格式良好的XML文档。
实体不仅可用于替代常规字符数据,还可以在标签属性中使用实体引用。
四 DOCTYPE声明
在XML文档中,<!DOCTYPE root_element>声明仅跟XML声明之后。实体的声明必须在
DOCTYPE声明只内。
<?xml version="1.0"?>
<!DOCTYPE class
[
<!ENTITY address "北京">
<!ENTITY man "男">
<!ENTITY woman "女">
]
>
<class>
<student>
<name>张三</name>
<sex>&man;</sex>
<address>&address;</address>
</student>
<student>
<name>李四</name>
<sex>&woman;</sex>
<address>&address;</address>
</student>
</class>
如果一个XML文档满足最低要求(在定义XML语法的XML 1.0 规范中定义),则该文档被
看作为格式良好。这些要求确保以正确的方式使用正确的词语。如果文档不满足任何一
个良好格式要求,则将发生致命错误。
有效的XML文档是格式良好的XML文档,符号Document Type Definition(文档类型定义
,DTD)的规则。DTD定义了文档中标记必须遵守的规则,还包含文档总体结构的定义。
如果满足以下条件,则使用元素、属性和实体创建的文档是格式良好的
(1)XML 标签区分大小写
(2)应正确结束标签
(3)正确嵌套标签
(4)合法的标签
标签必须以字母、下划线或冒号开始,然后是字母、数字、句号、冒号、下划线或连
字符的组合,但不能有空格。标签不能xml开头,因为它书保留字,最好别冒号开头(即
使是合法的),因为它会引起混淆。
(5)有效的属性
一个标签的属性不能重复。属性命名和标签命名相同。属性值可以包含空格、标点和实
体引用。所有的属性值都被看作为字符串。
五 DTD的结构
<!DOCTYPE dtd_name
[
<!ELEMENT element-name (element-content type)>
<!ATTLIST element-name attribute-name attribute-type default-value>
]
>
可以在XML文档中声明dtd,也可以存储在独立的文件。如果存储在独立的文件,使
用.dtd保存起来。
1. 声明元素
<!ELEMENT element-name (element-content type)>
在DTD中,使用元素声明来声明XML的元素。
2.空元素
<!ELEMENT element-name (EMPTY)>
EMPTY 表示该元素没有子元素或字符数据。将关键字放在括号中
3.带有数据的元素
带有数据的元素也叫叶子元素。
<!ELEMENT element-name (#CDATA)>
<!ELEMENT element-name (#PCDATA)>
<!ELEMENT element-name (any)>
#CDATA 指元素包含不会通过解析器进行解析的字符数据。#PCDATA 指元素包含能通过
解析器进行解析的字符数据。any 指该元素可以包含零个或零个以上任何类型的子元素
以及字符数据。因此,它是包含所有已声明元素的混合内容的简单表达方式。
4.带有子元素的声明
<!ELEMENT element-name (child-element-name,……)
子元素之间用逗号分开,这些子元素必须以其在文档中顺序来显示。
5.相同元素只出现一次
<!ELEMENT element-name (child-name)>
6.相同元素至少出现一次
<!ELEMENT element-name (child-name)+>
*号代表0次或多次,?号代表0次或1次,+号代表1次或多次
7 Default 属性值
为属性指定一个默认值,确保XML文档不提供值,该属性也将获取一个值
<!ATTLIST element-name attribute-name CDATA "default-value">
8 IMPLIED 属性值
表示属性值可有可无
<!ATTLIST element-name attribute-name CDATA #IMPLIED>
9 REQUIRED 属性值
表示属性值必须有
<!ATTLIST element-name attribute-name CDATA #REQUIRED>
10 FIXED
表示属性值是固定不变的
<!ATTLIST element-name attribute-name CDATA #FIXED "value">
七.属性类型
Enumerated 属性类型
希望属性值成为一组固定合法值的一员时。使用Enumerated
<!ATTLIST element-name attribute-name (eval|eval) default-value>
<!ATTLIST money type (人民币|美元) "人民币">
2.ID和IDREF 属性类型
ID是标识符类型,它应该是唯一的。
<!ATTLIST stundent id ID #REQUEIRED>
IDREF也是标识符类型,是引用别的元素属性类型为ID的。
3.IDREFS 属性类型
此属性是将多个属性类型为ID做为它的值,各个IDREF之间用空格隔开。
4.NMTOKEN和NMTOKENS属性类型
是用来检查文档中属性值是否有空格的。
八.DTD中的内部实体
<!ENTITY entity-name "entity-value">
DTD的外部实体
<!ENTITY entity-name SYSTEM "url">
九.DTD 中的参数实体
<!ENTITY %p "a">
<!ENTITY class ((%p;)+)>
<!ENTITY %p; (name,age,sex)>
%p是参数实体,a是p的省略值。
参数实体主要用语结构相同的情况下。
十.XML的命名空间
Uniform Resource Identifier(统一资源标识符,URI)用于识别XML的命令空间。URI包
括Uniform Resource Name(统一资源名称,URN)和Uniform Resource Locator(统一资
源定位符)。URL包含对WEB上的某个文档或HTML页面的引用。URN是标识Internet资源全
球唯一编号。
命名空间语法:
xmlns:[prefix]="命名空间URL"
xmlns:是保留关键字。由于xml也是保留关键字,所以它不能做为前缀。前缀作用命名空
间的识别
分享到:
相关推荐
实验室管理系统 微信小程序+SSM毕业设计 源码+数据库+论文+启动教程 项目启动教程:https://www.bilibili.com/video/BV1BfB2YYEnS
基于java的苹果网吧计费管理系统设计与实现.docx
纸中世界-跳跃游戏.sb3
本操作指导用于在 ENA 系列网络分析仪 E5080B 上自定义校准件。目前 Keysight 网络分析仪的 PNA 系列 N52xxB、P50xx 系列、P937x 系列、PXI 板卡式网分以及 ENA 系列的 E5080B、E5081B 的操作界面均统一到如下界面,操作方式相同。
调查海域浮游动物各类群栖息密度的空间分布表格.docx
本项目“高校毕业生就业管理系统”是一套基于SSM框架(Spring+SpringMVC+MyBatis)精心开发的Java Web应用,旨在为高校毕业生、高校就业指导部门以及企业用户提供一个高效、便捷的就业信息管理平台。 系统主要功能包括:学生用户可以查看和发布个人简历,搜索并筛选合适的工作岗位,申请心仪的职位;企业用户可以发布招聘信息,筛选和查看应聘者的简历,进行面试邀请等操作;高校就业指导部门则可以对学生的就业情况进行统计和分析,以更好地提供就业指导服务。 此外,系统采用了B/S架构,用户只需通过浏览器即可访问,无需安装客户端软件,方便快捷。数据库设计合理,数据存储安全,系统性能稳定。 本项目的开发,不仅为计算机相关专业的学生提供了一个实践SSM框架的好机会,帮助他们更好地理解和掌握Java Web开发技术,还能有效提升高校毕业生的就业效率和质量。
电影剪辑 笔记MoviePy 最近升级到 v2.0,引入了重大的重大变化。有关如何更新 v2.0 代码的更多信息,请参阅本指南。MoviePy(在线文档在此处)是一个用于视频编辑的 Python 库剪切、连接、插入标题、视频合成(又名非线性编辑)、视频处理和创建自定义效果。MoviePy 可以读取和写入所有最常见的音频和视频格式,包括 GIF,并且可以在 Windows/Mac/Linux 上运行,并搭载 Python 3.9+。例子在此示例中,我们打开一个视频文件,选择 10 到 20 秒之间的子剪辑,在屏幕中心添加标题,然后将结果写入新文件# Import everything needed to edit video clipsfrom moviepy import *# Load file example.mp4 and keep only the subclip from 00:00:10 to 00:00:20clip = VideoFileClip("long_examples/example2.mp4").with_subcl
基于java的视频播放器系统设计与实现.docx
基于java的车辆出租管理系统设计与实现.docx
mqtt等协议的pcap文件
学习python
修木工施工规范及流程.docx
适用于 Windows/Linux 和 Python 3 (3.5/3.6/3.7) 的 Tensorflow Faster R-CNNtf-faster-rcnn使用 Python 3 在 Windows 和 Linux 上使用 Tensorflow Faster R-CNN这是在 Windows 和 Linux 上编译 Faster R-CNN 的分支。它深受这里和这里的出色工作的启发。目前,此存储库支持 Python 3.5、3.6 和 3.7。感谢@morpheusthewhite请注意我没有时间或意图修复此分支的所有问题,因为我不将其用于商业用途。我创建此分支只是为了好玩。如果您想做出任何承诺,我们非常欢迎。Tensorflow 已经发布了一个对象检测 API。请参考它。https: //github.com/tensorflow/models/tree/master/research/object_detection如何使用此分支安装 tensorflow,最好是 GPU 版本。按照说明操作。如果没有安装 GPU 版本,则需要注释掉代码中的所有 GP
Python是一种高级、解释型、面向对象的编程语言,以其简洁的语法、强大的功能和广泛的应用领域而著称。它无需事先编译,代码在运行时逐行解释执行,提供了极大的灵活性和快速开发的能力。Python支持多种数据类型,包括整数、浮点数、字符串、布尔值、列表、元组、字典和集合等,以及丰富的操作符和流程控制结构,使得开发者可以编写出复杂且灵活的代码。 Python拥有一个广泛的标准库,涵盖了文件操作、网络通信、文本处理、正则表达式、数学运算等多个领域,为开发者提供了大量的模块和函数。此外,Python还拥有丰富的第三方库,如NumPy、Pandas、Matplotlib等用于数据分析和可视化的库,以及Django、Flask等用于Web开发的框架,这些库和框架进一步扩展了Python的应用领域和功能。 Python在Web开发、数据科学、人工智能、自动化运维和游戏开发等多个领域都有广泛的应用。在Web开发方面,Python提供了Django和Flask等强大的Web框架,使得开发者可以轻松地开发出各种Web应用和网站。在数据科学领域,Python是数据科学家的首选工具,其强大的数据处理能力和丰
本项目是基于Python语言开发的西西家居全屋定制系统,旨在为家居行业提供一个高效、智能的定制解决方案。项目涵盖了从客户需求分析、设计方案生成、材料选购到最终订单生成的全过程,力求实现家居定制的数字化和智能化。 在主要功能方面,系统具备强大的客户管理模块,能够详细记录和分析客户的定制需求。设计模块则采用先进的三维建模技术,为客户提供直观、真实的家居设计方案预览。此外,系统还整合了丰富的材料数据库,方便客户根据自身喜好和预算进行材料选择。 框架方面,项目采用了B/S架构,确保了系统的稳定性和可扩展性。后端使用Python的Django框架,前端则结合了HTML、CSS和JavaScript等技术,实现了用户界面的友好和响应速度。 开发此项目的目的,不仅是为了满足家居行业对个性化定制的需求,也为计算机相关专业的学生提供了一个实践和学习的平台,有助于提升他们的实际开发能力。
Binance公共API连接器Python 这是一个轻量级库,可作为Binance 公共 API的连接器支持的 API/api/*/sapi/*现货 Websocket 市场动态现货用户数据流现货 WebSocket API包含测试用例和示例可定制的基本 URL、请求超时和 HTTP 代理可以显示响应元数据安装pip install binance-connector文档https://binance-connector.readthedocs.ioRESTful API使用示例from binance.spot import Spotclient = Spot()# Get server timestampprint(client.time())# Get klines of BTCUSDT at 1m intervalprint(client.klines("BTCUSDT", "1m"))# Get last 10 klines of BNBUSDT at 1h intervalprint(client.k
Aptana是一个非常强大,开源,JavaScript-focused的AJAX开发IDE。 Aptana的特点包括: 1JavaScript,HTML,CSS语言的Code Assist功能。 2Outliner(大纲):显示JavaScript,HTML和CSS的代码结构。
学习自律养成小程序 微信小程序+SSM毕业设计 源码+数据库+论文+启动教程 项目启动教程:https://www.bilibili.com/video/BV1BfB2YYEnS
认知能力评估表.docx
数学建模学习资料 粒子群算法 先进算法讲义.pdf