`

HTML5标准学习 – DOCTYPE

 
阅读更多

 

上一篇文章主要讲述了HTML文档的构成,同时肤浅地接触了“标签省略”这一概念,本文会从概念上介绍HTML文档中第一个出现的重要元素 – DOCTYPE。

所谓DOCTYPE,最初是XML的概念,即通过一种特定的语法,作为一种元数据,来描述XML文档中允许出现的元素,以及各元素的组成、嵌套规则等。具体的概念可以在WIKI中中得到一个更详细的结果。

但是在HTML中,DOCTYPE又有着一些不同的效果,其中之一就是著名的触发浏览器标准模式的功能。即如果没有DOCTYPE,浏览器会进入一种被称为Quirks模式的怪异状态,在该模式下,浏览器的盒模型、样式解析、布局等都与标准规定的存在差异。

需要注意的是,所谓的HTML标准、DOM标准等,只规定了在标准模式下的概念和行为,正如文档构成中提到的,DOCTYPE是一个HTML文档绝对不可以省略的部分,因此就根本不存在“Quirks模式”这样的概念。也正是因为标准中没有对Quirks模式做出任何的规定,因此不同浏览器在Quirks模式下的处理也是不同的,应用Quirks模式可谓难上加难。

HTML4的DOCTYPE

在HTML4的标准中,DOCTYPE被归属于“HTML版本信息”一章中。在该章节中,标准指定了3种DOCTYPE:

  • 严格模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
  • 过渡模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
  • 框架模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">

在HTML4的标准中,每一个DOCTYPE对应的dtd文件都是有合法的URL指定的,可以通过互联网进行下载。浏览器可以根据URL获得到dtd的具体内容,并根据内容的规定来解析文档。

现实是不同的

HTML4如同XML一样,是一个相当理想化的标准。但是,现实往往并没有这么理想,试想下面的HTML文档:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
                      "http://www.w3.org/TR/html4/frameset.dtd">
<html>
    <head>
        <title>I'm not a frameset</title>
    </head>
    <body>
        <p>So what?</p>
    </body>
</html>

这个文档采用了一个框架模式的DOCTYPE,但其正文确没有使用任何<frame>元素,相对应地使用了应该由严格模式或者过渡模式指定的,标准的HTML结构。那么在这种情况下,浏览器能做什么呢?

拒绝渲染该页面?不,浏览器不敢这么做,在激烈的市场竞争之中,如果因此而导致部分页面无法渲染的话,就只能眼睁睁看着市场份额注入别家田了。所以浏览器顶多弱弱地报一个警告以示抗议,却依旧得乖乖地解析出这个文档并正确渲染。

这就是所谓的浏览器的“容错性”,事实上无论你的DOCTYPE是什么,浏览器都会以最大的兼容能力去解析一个文档,并以最大的努力让这个文档显示得符合开发者的预期。而浏览器的这一特性,也逐渐让标准制定者开始意识到,DOCTYPE似乎真的不怎么重要。因此,在HTML5中,DOCTYPE发生了一次重大的变化……

HTML5的DOCTYPE

到了HTML5了,这一变化相信多数人已经知道,就是HTML5将DOCTYPE的声明简化了,只需要<!DOCTYPE html>即可。

正好前文所述,在HTML4时代,标准制定者已经认识到,DOCTYPE对浏览器的渲染并没有太大的帮助,除了给无聊的w3c验证器看以外,DOCTYPE似乎只有触发浏览器兼容模式的作用。于是标准工作组采取了非常实际的态度,测试了所有课程顺触发标准模式的最简DOCTYPE,最终得出了这一结论。

但是故事不会这么简单,标准工作组也不是完成这么简单的动作就撒手不管的无赖分子,事实上他们还是很尽责任地考虑到了向后兼容性、可扩展性等一系列的事情,最后将DOCTYPE一章用了大量文字来进行描述,得到一个非常详实的结果。

HTML5的参考手册相关章节中,将DOCTYPE分为3类:

普通DOCTYPE – normal doctype

普通DOCTYPE就是我们所见的最简形式,即<!DOCTYPE html>,他的真正组成是这样的:

  1. 一段文本,即<!DOCTYPE,大小写不敏感。
  2. 1个或多个空格,关于空格的定义请参照简介中的解释。
  3. 字符HTML,同样大小写不敏感。
  4. 1个或多个空格。
  5. 结束标记,即>
不再推荐的DOCTYPE – deprecated doctype

即所谓HTML4时代的几个DOCTYPE,其组成如下:

  1. 一段文本,即<!DOCTYPE,大小写不敏感。
  2. 1个或多个空格。
  3. 字符HTML,同样大小写不敏感。
  4. 1个或多个空格。
  5. 字符PUBLIC,大小写不敏感。
  6. 继续1个或多个空格。
  7. 一对引号或单引号(必须前后匹配),引号中放一个Public ID。
  8. 可选内容:
    1. 1个或多个空格。
    2. 一对引号或单引号(必须前后匹配),引号中放一个与前面的Public ID对应的System ID。
  9. 1个或多个空格。
  10. 结束标记,即>

在标准中,Public ID和System ID是有严格的对应关系的,如果规定的System ID不能有Public ID,则上面的第8项可选内容也就不能存在。HTML5彻底放弃了HTML4中的过渡型和框架型的DOCTYPE,同时整合了XHTML的DOCTYPE声明,得出以下6种组合方式:

  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
遗留工具DOCTYPE – leagacy tool compatible doctype

顾名思义,完全是为了兼容久远时代的历史遗产而准备的DOCTYPE,甚至都已经没办法考证什么样的“工具”会搞出这种DOCTYPE来……遗留工具型的DOCTYPE的组成如下:

  1. 一段文本,即<!DOCTYPE,大小写不敏感。
  2. 1个或多个空格。
  3. 字符HTML,同样大小写不敏感。
  4. 1个或多个空格。
  5. 字符SYSTEM,大小写不敏感。
  6. 继续1个或多个空格。
  7. 一对引号或单引号(必须前后匹配),引号中放一段文本about:legacy-compat,注意这段文本是大小写敏感的。
  8. 1个或多个空格。
  9. 结束标记,即>

比如这样的DOCTYPE就属于此类:<!doctype HTML system "about:legacy-compat">,基本上除了大小写,没有什么值得改变的。

现实的细节

对于DOCTYPE的作用,在真正的浏览中,仅仅起到触发浏览器的标准模式的作用。虽然根据标准,一个HTML文档中,DOCTYPE前可以有其他的元素,如一个U+FFEF的BOM,几个注释,一点空格,但是在当前的状态下,并没有这么理想:

  • 对于IE6-9,如果DOCTYPE前存在注释,会进入Quirks模式。
  • 对于IE6,如果DOCTYPE前存在一个XML声明,会进入Quirks模式。

写完才发现,问题又全出在IE下……关于DOCTYPE的问题纠结至此,下一章主要讲述编码声明的问题。

分享到:
评论

相关推荐

    HTML !DOCTYPE 标签 声明HTML版本

    DOCTYPE&gt;并不是HTML标签,它声明web浏览器关于页面使用哪个 HTML 版本进行编写的指令。 在 HTML 4.01 中,&lt;!DOCTYPE&gt; 声明引用 DTD,因为 HTML 4.01 基于 SGML。DTD 规定了标记语言的规则,这样浏览器才能正确地呈现...

    HTML 元素与合法的 Doctype.docx

    HTML(HyperText Markup Language)是用于创建网页的标准标记语言,DOCTYPE是HTML文档中的一个重要部分,它定义了文档遵循的HTML或XHTML规范的版本。DOCTYPE声明位于HTML文档的顶部,通常在`&lt;html&gt;`标签之前,告诉...

    HTML !DOCTYPE 标签.docx

    值得注意的是,HTML5不再需要引用DTD,其DOCTYPE声明简化为: ```html &lt;!DOCTYPE html&gt; ``` 这是因为HTML5旨在兼容所有浏览器,并且不再区分严格和过渡模式。 使用正确的DOCTYPE声明有助于确保文档遵循特定的标准,...

    网页 DOCTYPE html标签的作用1

    DOCTYPE html&gt;` 是HTML5规范中的声明方式,它表明当前文档是一个符合HTML5标准的网页。在HTML5之前,不同的DOCTYPE声明对应着不同的HTML或XHTML版本,例如: - HTML4.01 Strict:`&lt;!DOCTYPE HTML PUBLIC "-//W3C//...

    html标题_DOCTYPE的含义

    **DOCTYPE声明**是HTML或XHTML文档中的一个重要组成部分,它位于文档的第一行,用来告诉浏览器文档应遵循哪个版本的HTML或XHTML规范。这个声明对于确保网页在不同浏览器上的一致性和正确渲染至关重要。 DOCTYPE声明...

    DOCTYPE html PUBLIC.doc

    DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"&gt;` 这行代码定义了文档类型为XHTML 1.0 Transitional,这是一种过渡性的HTML版本,允许...

    DOCTYPE文档类型声明

    DOCTYPE文档类型声明是HTML或XHTML文档中的一个重要组成部分,它位于文档的最顶部,用于告知浏览器文档遵循的规范和标准。DOCTYPE声明不是HTML或XHTML的一部分,而是引用了一个外部的文档类型定义(DTD),这个DTD...

    DOCTYPE HTML.html

    DOCTYPE HTML.html

    HTML和XHTML的联系与区别,文档类型<!DOCTYPE>

    DOCTYPE&gt;`声明位于HTML或XHTML文档的顶部,它的主要作用是告诉浏览器应以何种标准解析文档。不同的`&lt;!DOCTYPE&gt;`声明会导致浏览器进入不同的渲染模式,如quirks mode(兼容模式)和standards mode(标准模式)。在...

    为什么使用DOCTYPE HTML

    在HTML5中,不再需要指定DTD,因为HTML5本身就是向后兼容的,它的DOCTYPE声明仅用于开启标准模式。 要检测浏览器当前是运行在怪异模式还是标准模式,可以使用JavaScript的`document.compatMode`属性。如果返回值为`...

    doctype html

    meta name="viewport" content="user-scalable=no, initial-scale=1, maximum-scale=1, minimum-scale=1, width=device-width, height=device-height" /&gt; ...

    DOCTYPE html.docx

    在这个例子中,使用的是HTML5的DOCTYPE声明, δηλDOCTYPE html。 HTML文档头(Head) HTML文档头是HTML文档的开始部分,用于存放一些元数据,例如标题、关键词、描述等信息。HTML文档头的主要内容包括: * ...

    HTML的!DOCTYPE是什么意思.zip_zip和rar区别

    HTML的!DOCTYPE是什么意思.zip

    DOCTYPE html.xml

    DOCTYPE html.xml

    Doctype html.txt

    Doctype html.txt

    HTML DOCTYPE的缩写

    在讨论HTML DOCTYPE的缩写之前,我们先来了解一下DOCTYPE声明的作用以及其在HTML文档中的位置。DOCTYPE声明是一个必须位于HTML...因此,开发者在学习和使用DOCTYPE时,应当掌握正确的知识,并在实际编码中审慎处理。

    DOCTYPE.rar_page

    总的来说,这个压缩包可能是一个学习资源,用于教授初学者如何创建符合标准的HTML页面,重点是DOCTYPE的使用和其在HTML页面中的重要性。通过解压并查看DOCTYPE.docx文件,可以深入理解DOCTYPE的相关知识,包括其作用...

    HTML 版本声明 DOCTYPE 标签

    比如,正确声明HTML5的DOCTYPE将引导浏览器进入标准模式,这样页面就会按照最新的标准规范正确渲染。相反,如果没有声明DOCTYPE或声明错误,则可能导致浏览器进入怪异模式(quirks mode),在这种模式下,页面可能会...

    DOCTYPE HTML PU.docx

    在给定的文件中,我们看到了一个HTML文档的结构,其中包含了HTML5的DOCTYPE声明、元数据、样式表以及JavaScript代码。这个文档似乎是一个简单的网页,具有动态粒子效果的背景和一个固定在屏幕中央的文本元素。以下是...

    html5 基础学习

    HTML5是下一代超文本标记语言,它在2014年被正式标准化,为Web开发引入了许多新的元素、属性和API,旨在提升用户体验,增强网页的互动性和多媒体表现力。这个压缩包文件“html5基础学习”包含了学习HTML5的重要资源...

Global site tag (gtag.js) - Google Analytics