新时代新潮流 WebOS 【20】WebKit的结构与解构
转载网址:http://www.ifanr.com/17780
sunny_kangravatarcloseAuthor: sunny_kan Name: Sunny Cheng 邓侃
Email: cheng.sunny@gmail.com
Site:
About: Sunny-Kan 为邓侃及 Sunny 的共笔帐号。邓侃现居北京,Sunny 现旅居欧洲,皆为经年浸淫 IT 及互联网的资深业界牛人,行文鞭辟入里,妙笔生花。 Sunny Cheng,sunny.cheng@gmail.com 邓侃, kan.deng@gmail.comSee Authors Posts (43) 于 2009-5-25,20:54 Comments (0)
归类于:心得体会 标签: dom, IT, tree, Webkit, 浏览器.
【20】WebKit的结构与解构
从指定一个HTML文本文件,到绘制出一幅布局复杂,字体多样,内含图片音频视 频等等多媒体内容的网页,这是一个复杂的过程。在这个过程中Webkit所做的一切,都是围绕DOM Tree和Rendering Tree这两个核心。上一章我们谈到这两棵树各自的功用,这一章,我们借一个简单的HTML文件,展示一下DOM Tree和Rendering Tree的具体构成,同时解剖一下Webkit是如何构造这两棵树的。
From HTML to webpage, and the underlying DOM tree and rendering tree
Figure 1. From HTML to webpage, and the underlying DOM tree and rendering tree.
1. DOM Tree 与 Rendering Tree 的结构
Figure 1中左上是一个简单的HTML文本文件,右上是Webkit rendering engine绘制出来的页面。页面的内容包括一个标题,“AI”,一行正文,“Ape’s Intelligence”,以及一幅照片。整个页面分成前后两个层面,标题和正文绘制在前一个层面,照片处于后一个层面。L君和我亦步亦趋地跟踪了,从解析这个HTML文本文件,到生成DOM Tree和Rendering Tree的整个流程,目的是为了了解DOM Tree和Rendering Tree的具体成份,以及构造的各个步骤。
先说Figure 1中左下角的DOM Tree。基本上HTML文本文件中每个tag,在webkit/webcore/html中都有一个class与之对应。譬如<HTML> tag 对应HTMLHtmlElement,<HEAD> tag 对应HTMLHeadElement,<STYLE> tag 对应HTMLStyleElement 等等。比较特别的是DOM Tree的根节点,HTMLDocument,在HTML文本文件中没有哪个tag与之对应。关于HTMLDocument的作用,我们稍后介绍。整个 DOM Tree的结构,与HTML文本文件中各个tags的嵌套关系也一一对应。一言以蔽之,DOM Tree就是把HTML文本文件翻译成object树状结构。
需要强调的是,DOM Tree是一个通用数据结构,任何XML文本文件都可以翻译成DOM Tree,而不仅仅限于HTML文本文件。webkit/webcore/html 中林林总总html classes,基本上都是webkit/webcore/dom 中的某个class的子类,也就是说,/html 是 /dom的一个特例。这样的设计,为将来把Webkit拓展到HTML格式以外的页面的布局和渲染,埋下了伏笔。所以严格地讲,Figure 1中左下的DOM Tree,实际上是一个HTML DOM Tree。
再看Rendering Tree,显著的特点在于,
a. 整个Rendering Tree树状结构,与HTML DOM Tree树状结构一一对应。也就是说,几乎每个HTML DOM Tree中的节点,在Rendering Tree中都有对应的节点。节点与节点之间的父子或兄弟关系也一一对应。
例外的是,在HTML DOM Tree有HTMLStyleElement叶子节点,而在Rendering Tree中,没有相应的叶子节点。原因是,Rendering Tree各个节点,都涉及页面中某块区域的布局和渲染。而HTMLStyleElement,并不直接涉及某块区域的布局和渲染,HTML DOM Tree中HTMLStyleElement叶子节点包含的内容,已经融入Rendering Tree中RenderImage叶子节点的属性中去了。另外,因为Rendering Tree中不存在与HTMLStyleElement相应的叶子节点,所以,与HTMLHeadElement对应的节点也没有必要存在。
b. webkit/webcore/rendering中各个class与HTML tags并没有一一对应的关系。
Rendering Tree是一个通用的规划页面布局和渲染的机制,这个通用机制可以服务于HTML页面,但是并不仅仅限于为HTML页面服务,我们可以用 Rendering Tree来规划其它格式的页面的布局和渲染。以DOM Tree和Rendering Tree为核心的Webkit渲染机,是一个功能强大,扩展性良好的通用渲染机。它不仅可以用来绘制HTML页面,也可以用来渲染其它格式的页面,譬如可 以用它来制作email阅读和管理器,制作数据库管理工具,甚至制作游戏界面。
稍微让人有点吃惊的是,对于 HTMLHtmlElement,HTMLBodyElement,HTMLHeadingElement和HTMLParagraphElement, 在Rendering Tree中通通以RenderBlock呼应。如果说HTMLHeadingElement和HTMLParagraphElement的区别不大,仅仅 是字体和对齐方式有些微小的差别,所以Rendering Tree可以用RenderBlock来统一应对。那么问题是,HTMLHtmlElement和HTMLBodyElement是两种容器,总是出现在 DOM Tree的中部,而从来不会作为叶子节点出现,对应于这样的容器节点,为什么Rendering Tree不另设一种class,与RenderBlock有所区别呢?不过话又说回来,这不是个大问题,最多是个美感的问题。
The construction sequence of the root of the DOM tree Figure 2. The construction sequence of the root of the DOM tree.
2. DOM Tree 与 Rendering Tree 的根节点
前一节中我们提到HTMLDocument是一个比较特殊的class,它是整个HTML DOM Tree的根节点,但是不对应任何HTML tag。JavaScript中经常出现的document,指的就是这个根。例如,
“document.getElementByIdx(x).style.background=”yellow”;”
HTML文本文件,通常是以<HTML>开头,以</HTML>结尾。但是<HTML> tag并不对应DOM Tree的根节点,而是根以下的第一个子节点,即HTMLHtmlElement节点。
初看Figure 2 觉得有点意外,当用户在浏览器里打开一个空白页面的时候,立刻生成了DOM Tree的根节点HTMLDocument,与Rendering Tree的根节点RenderView。而这个时候,用户并没有给定URL,也就是说,对于浏览器来讲,这时候具体的HTML文本文件并不存在。根节点与 具体HTML内容相脱节,或许暗示了Webkit的两个设计思路,
a. DOM Tree的根节点HTMLDocument,与Rendering Tree的根节点RenderView,可以重复利用。
当用户在同一个浏览器页面中,先后打开两个不同的URLs,也就是两个不同的HTML文本文时,HTMLDocument和RenderView两个根节点并没有发生改变,改变的是HTMLHtmlElement以下的子树,以及对应的Rendering Tree的子树。
为什么这样设计?原因是HTMLDocument和RenderView服从于浏览器页面的设置,譬如页面的大小和在整个屏幕中的位置等等。这些设置与页面中要显示什 么的内容无关。同时HTMLDocument绑定HTMLTokenizer和HTMLParser,这两个构件也与某一个具体的HTML内容无关。
b. 同一个DOM Tree的根节点可以悬挂多个HTML子树,同一个Rendering Tree的根节点可以悬挂多个RenderBlock子树。
在我们目前所见到的浏览器中,每一个页面通常只显示一个HTML文件。虽然一个HTML文件可以分割成多个frames,每个frame承载一个独立的 HTML文件,但是从DOM Tree结构来讲,HTMLDocument根节点以下,只有一个子节点,这个子节点是HTMLHtmlElement,它领衔某个HTML文本文件对应 的子树。Rendering Tree也一样,目前我们见到的网页中,一个RenderView根节点以下,也只有一个RenderBlock子节点。
但是Webkit的设计,却允许同一个根以下,悬挂多个HTML子树。虽然我们目前没有看到一个页面中,并存多个HTML文件,并存多个布局和渲染风格的情景,但是Webkit为将来的拓展留下了空间。前文中所设想的个性化,多皮肤,多视角的浏览器页面绘制,用Webkit实现起来难度不大。
The construction sequence of the DOM Tree and the Rendering Tree Figure 3. The construction sequence of the DOM Tree and the Rendering Tree.
3. DOM Tree 与 Rendering Tree 的构筑
HTMLDocument 根节点包含的最重要的构件是HTMLTokenizer,而HTMLTokenizer又包含HTMLParser这个构件。HTMLTokenizer 从前到后读取HTML文本文件中每一个字符,并从中提取出各个HTML tags以及它们的内容。而HTMLParser不仅负责HTML DOM Tree的构筑,而且也同时负责Rendering Tree的构筑。
在Figure 3中,从第8步到第11步,HTMLParser根据一个HTML Tag生成一个HTML DOM Tree节点。从第12步到第17步,生成相应的Rendering Tree的节点,并把它和HTML DOM Tree的节点勾连在一起。这张图的细节过多,读解不容易。Figure 4把第8步到第17步演示了一下。
An illustration of the construction of a DOM tree node and its corresponding Rendering tree node Figure 4. An illustration of the construction of a DOM tree node and its corresponding Rendering tree node.
值得注意的是,每当HTMLParser生成一个DOM Tree的节点的时候,相应地,也同时生成一个Rendering Tree节点。然后把它们两个新节点勾连在一起。换而言之,Rendering Tree与DOM Tree同步生长。
Webkit 值得赞赏的地方非常多,但是HTMLParser让DOM Tree和Rendering Tree同步生长的做法,却值得商榷。如果同步生长,那么Rendering Tree必然平铺直叙地刻板地忠实于DOM Tree。假设先生成DOM Tree,再生成Rendering Tree,把两者割裂开,就有机会让Webkit发挥更加奇妙的布局和渲染。平铺直叙固然符合大多数人在大多数时间里的阅读习惯,但是离经叛道的设计,也会有市场。一个例子就是上一章末尾处那张多视点的地图。如果让DOM Tree与Rendering Tree同步生长,这样的布局和渲染是难以想像的。
分享到:
相关推荐
### WebKit JavaScript引擎深入分析 #### 一、概述 **WebKit**是一款开源的浏览器引擎,由Apple公司在2005年发起,旨在提供一个高效、跨平台的网页浏览体验。WebKit不仅仅是一个渲染引擎,它还包含了一系列核心...
webkitJS引擎深入分析, 分析的很不错。
统一模式的WebKit浏览器渲染引擎的利弊 在互联网时代,浏览器渲染引擎的选择对用户和开发者的影响非常大。近期,Opera 宣布转向使用开源的 WebKit 引擎,这引起了业界的大讨论。那么,到底是使用统一的 WebKit ...
WebKit 内核源码分析_ALL WebKit 内核源码分析是对 WebKit 内核架构的深入分析,主要关注 Frame 类的设计和实现。Frame 类是 WebCore 内核同应用之间联系的一个重要的类,作为 Façade 模式的实现,将内核的各个...
通过阅读这个“webkit分析报告”,你可以深入了解 WebKit 的设计哲学、工作流程和技术细节,这对于理解和开发基于 WebKit 的浏览器或者其他依赖 WebKit 的应用都有极大的帮助。同时,也可以从中学习到如何优化网页...
### Qt集成WebKit:渲染、使用和扩展网络技术 #### 一、奠定基础 在现代软件开发领域,跨平台的应用程序框架和技术变得越来越重要。Qt 和 WebKit 的集成就是这一趋势中的一个重要里程碑。Qt 是一个非常成熟且强大...
webkit的代码分析资料。包括很多介绍webkit的资料
cpp-Sling是一个强大的开源项目,它实现了对多平台的支持,并且基于WebKit技术构建了一个高效的渲染引擎。WebKit是一种广泛使用的网页渲染引擎,它被许多著名的浏览器如Safari和Chrome所采用,因为其性能优异且跨...
本系列通过分析WebKit的源代码,试图分析WebKit的内核设计架构,模块之间的关系,分析的时候以QT的移植为参考,涉及移植的东西不多,主要还是以内核为主。在分析内核的时候,Frame是首当其冲的一个类,本文将分析...
在分析这些UML图时,我们可以深入了解Webkit的架构,例如多进程架构,其中渲染进程与JavaScript引擎进程分离,提高了安全性与稳定性。此外,还可以研究Webkit的渲染流程,包括HTML解析、CSS布局计算、绘制等步骤。 ...
**WebKit渲染引擎详解** WebKit,一个开源的网页渲染引擎,被广泛应用于许多浏览器,如苹果的Safari和谷歌的Chrome。它负责解析HTML、CSS、JavaScript等Web标准,并将它们转化为用户可交互的网页。本资料集合包含了...
WebKit是全球广泛使用的网页渲染引擎,驱动着许多主流浏览器,如Safari和Chrome。WebCore是WebKit的核心部分,负责网页内容的解析、布局和渲染。 在WebKit的源代码中,我们可以看到以下几个关键的知识点: 1. **...
WebKit 是一个开源的网页浏览器引擎,被广泛用于苹果的 Safari 浏览器以及许多其他移动设备上的浏览器。它解析HTML、CSS、JavaScript,并处理图像、视频和其他多媒体内容,为用户提供了一个高效的浏览体验。这份...
Android4.1 WebKit流程分析图包括 详细的网络请求流程,下载流程,代理流程
本系列通过分析WebKit的源代码,试图分析WebKit的内核设计架构,模块之间的关系,分析时以QT的移植为参考,涉及移植的东西不多,主要还是以内核为主。FrameLoader类负责一个Frame的加载,在Frame的流程中起到非常...
通过以上分析可以看出,Android中的WebKit不仅仅是一个简单的浏览器引擎,而是一个高度复杂且功能强大的系统。它通过一系列精心设计的模块和机制,实现了高效、稳定且兼容性良好的网页渲染与加载能力。对于开发者来...
Webkit引擎会负责解析和渲染这些内容。此外,还可以通过事件监听来处理页面加载状态的变化,如`DocumentCompleted`事件,以及用户的交互行为,如点击链接、表单提交等。 在不依赖IE的情况下,WebKit.NET提供了一个...
Java集成WebKit浏览器是一种技术实践,它允许Java应用程序利用WebKit渲染引擎来展示网页内容。WebKit是一个开源的Web浏览器引擎,被广泛应用于Safari、Chrome等知名浏览器。在Java中集成WebKit,开发者可以创建具有...
Webkit内核是开源的网页渲染引擎,广泛应用于各种浏览器,如Safari、Chrome等,其源代码分析对于深入理解网页渲染原理、优化前端性能以及进行浏览器开发具有极高的价值。下面将对Webkit内核的主要组成部分、核心功能...