`

lua 5.0的实现(翻译)1,2,3部分

阅读更多

三个多月前翻译的,今天又找出来看看,后面的整理再发。

 

原文:http://www.tecgraf.puc-rio.br/~lhf/ftp/doc/jucs05.pdf

翻译:dennis zhuang (killme2008@gmail.com)  http://www.blogjava.net/killme2008

转载请注明出处,谢谢。

 

摘要:我们讨论了lua 5.0实现的主要新特性:基于寄存器的虚拟机,优化表的新算法以便(将表)用作数组,闭包的实现,以及coroutines(译注:协程)

关键字: compilers, virtual machines, hash tables, closures, coroutines

 

<!---->1.    <!---->介绍

Lua作为内部使用的开发工具诞生于学术实验室中,现在却已经被世界范围内许多工业级项目所采用,广泛应用于游戏领域。Lua为什么能获得这样广泛的应用呢?我们认为答案就来源于我们的设计和实现目标上:提供一种简单、高效、可移植和轻量级的嵌入式脚本语言。这是Lua1993年诞生以来我们一直追求的目标,并在(语言的)演化过程中遵守。这些特性,以及Lua一开始就被设计成嵌入大型应用的事实,才使它在早期被工业界所接受。

 

广泛的应用产生了对(新的)语言的特性的需求。Lua的许多特性来自于工业需求和用户反馈的推动。重要的例如lua 5.0引入的coroutines和即将到来的Lua 5.1改进的垃圾收集实现,这些特性对于游戏(编程)特别重要。

 

在这篇论文中,我们讨论了lua 5.0相比于lua 4.0的主要新特性:

基于寄存器的的虚拟机:传统上,绝大多数虚拟机的实际执行都是基于栈,这个趋势开始于PascalPmachine,延续到今天的java虚拟机和微软的.net环境。目前,尽管对于基于寄存器的虚拟机的兴趣逐渐增多(比如Perl6计划中的新的虚拟机(Parrot)将是基于寄存器的),但是就我们所知,lua 5.0是第一个被广泛使用的基于寄存器的虚拟机。我们将在第7部分描述这个虚拟机。

 

优化表的新算法以便作为数组: 不像其他脚本语言,Lua并没有提供数组类型。Lua使用整数索引的普通表来实现数组作为替代。Lua 5.0使用了一个新的算法,可以检测表是否被作为数组使用,并且可以自动将关联着数字索引的值存储进一个真实的数组,而不是将它们放进Hash表。在第4部分我们将讨论这个算法。

 

闭包的实现:lua 5.0在词法层次上支持first-class 函数(译注:将函数作为一等公民)。这个机制导致一个著名的语言难题:使用基于数组的栈来存储激活记录。Lua 使用了一个新办法来实现函数闭包,保存局部变量在(基于数组)的栈(stack)上,当它们被内嵌函数引用而从作用域逸出的时候才将它们转移到堆(heap)上。闭包的实现将在第5部分讨论。

添加coroutines lua 5.0语言引入了coroutines。尽管coroutines的实现较为传统,但为了完整性我们将在第6部分做个简短的概况介绍。

 

其他部分是为了讨论的完整性或者提供背景资料。在第2部分我们介绍了lua的设计目标以及这个目标如何驱动实现的概况。在第3部分我们介绍了lua是如何表示值的。尽管就这个过程本身没有什么新意,但是为了(理解)其他部分我们需要这些资料。最后,在第8部分,我们介绍了一个小型的基准测试来得到一些结论。

 

<!---->2.    <!---->lua设计和实现概况

在介绍部分提到过的,lua实现的主要目标是:

 

简单性:我们探索我们能提供的最简单的语言,以及实现(这样的)语言的最简单的C代码。这就意味着(需要)不会偏离传统很远的拥有很少语言结构的简单语法。

 

效率:我们探索编译和执行lua程序的最快方法,这就意味着(需要)一个高效的、聪明的一遍扫描编译器和一个高效的虚拟机。

 

可移植性:我们希望lua能跑在尽可能多的平台上。我们希望能在任何地方不用修改地编译lua核心,在任何一个带有合适的lua解释器的平台上不用修改地运行lua程序。这就意味着一个对可移植性特别关注的干净的ANSI C的实现,例如避开C和标准库库中的陷阱缺陷,并确保能以c++方式干净地编译。我们追求warning-free的编译(实现)。

 

嵌入性:lua是一门扩展语言,它被设计用来为大型程序提供脚本设施。这个以及其他目标就意味着一个简单并且强大的C API实现,但这样将更多地依赖内建的C类型。

 

嵌入的低成本:我们希望能容易地将Lua添加进一个应用,而不会使应用变的臃肿。这就意味着(需要)紧凑的C代码和一个小的Lua核心,扩展将作为用户库来添加。

 

这些目标是有所权衡的。例如,lua经常被用作数据描述语言,用于保存和加载文件,有时是非常大的数据库(M字节的lua程序不常见)。这就意味着我们需要一个快速的lua编译器。另一方面,我们想让lua程序运行快速,这就意味着(需要)一个可以为虚拟机产生优秀代码的聪明的编译器。因此,LUA编译器的实现必须在这两种需求中寻找平衡。尽管如此,编译器还是不能太大,否则将使整个发行包变的臃肿。目前编译器大约占lua核心大小的30%。在内存受限的应用中,比如嵌入式系统,嵌入不带有编译器的Lua是可能的,Lua程序将被离线预编译,然后被一个小模块(这个小模块也是快速的,因为它加载的是二进制文件)在运行时加载。

 

Lua使用了一个手写的扫描器和一个手写的递归下降解释器。直到3.0版本,lua还在使用一个YACC产生的解释器,这在语言的语法不够稳定的时候很有价值的。然而,手写的解释器更小、更高效、更轻便以及完全可重入,也能提供更好的出错信息(error message)。

Lua编译器没有使用中间代码表示(译注:也就是不生成中间代码)。当解释一个程序的时候,它以“on-the-fly”的 方式给虚拟机发出指令。不过,它会进行一些优化。例如,它会推迟像变量和常量这样的基本表达式的代码生成。当它解释这样的表达式的时候,没有产生任何代 码,而是使用一种简单的结构来表示它们。所以,判断一个给定指令的操作数是常量还是变量以及将它们的值直接应用在指令都变的非常容易,避免了不必要的和昂 贵的移动。

为了轻便地在许许多多不同的C编译器和平台之间移植,Lua不能使用许多解释器通常使用的技巧,例如direct threaded code [8, 16]。作为替代,它(译注:指lua解释器)使用了标准的while-switch分发循环。此处的C代码看起来过于复杂,但是复杂性也是为了确保可移植性。当lua在许多不同的平台上(包括64位平台和一些16位平台)被很多不同的C编译器编译,lua实现的可移植性一直以来变的越来越稳定了。

我们认为我们已经达到我们的设计和实现目标了。Lua是一门非常轻便的语言,它能跑在任何一个带有ANSI C编译器的平台上,从嵌入式系统到大型机。Lua确实是轻量级的:例如,它在linux平台上的独立解释器包括所有的标准库,占用的空间小于150K;核心更是小于100Klua是高效的:独立的基准测试表明lua是脚本语言(解释的、动态类型的语言)领域中最快的语言之一。主观上我们也认为lua是一门简单的语言,语法上类似Pascal,语义上类似Scheme(译注:Lisp的一种方言)。

 

3、值的表示

Lua是动态类型语言:类型依附于值而不是变量。Lua8种基本类型:nil, boolean, number, string, table, function,userdata, threadNil是一个标记类型,它只拥有一个值也叫nilBoolean就是通常的truefalseNumber是双精度浮点数,对应于C语言中的double类型,但用float或者long作为替代来编译lua也很容易(不少游戏consoles或者小机器都缺乏对double的硬件支持)String是有显式大小的字节数组,因此可以存储任意的二进制类型,包括嵌入零。Table类型就是关联的数组,可以用任何值做索引(除了nil),也可以持有任何值。Function是依据与lua虚拟机连接的协议编写的lua函数或者C函数。Userdata本质上是指向用户内存区块(user memory block)的指针,有两种风格:重量级,lua分配块并由GC回收;轻量级,由用户分配和释放(内存)块。最后,thread表示coroutines。所有类型的值都是first-class值:我们可以将它们作为全局变量、局部变量和table的域来存储,作为参数传递给函数,作为函数的返回值等等。

 

typedef struct {                        typedef union {

int t;                                      GCObject *gc;

Value v;                                   void *p;

} TObject;                                 lua_Number n;

int b;

} Value;

Figure 1: 带标签的union表示lua

 

 

Lua将值表示为带标签的union(tagged unions),也就是pairs(t,v),其中t是一个决定了值v类型的整数型标签,而v是一个实现了lua类型的C语言的union结构。Nil拥有一个单独的值(译注:也就是nil)。Booleansnumbers被实现为“拆箱式”的值:vunion中直接表示这些类型的值。这就意味着union(译注:指图中的Value)必须有足够的空间容纳double(类型)。Strings,tables, functions, threads, userdata类型的值通过引用来实现:v拥有指向实现这些类型的结构的指针。这些结构(译注:指实现Strings,tables, functions, threads, userdata这些类型的具体结构)共享一个共同的head,用来保存用于垃圾收集的信息。结构的剩下的部分专属于各自的类型。

 Figure1展示了一个实际的lua值的实现。TObject是这个实现的主要结构体:它表示了上文描述的带标签的联合体(tagged unions (t,v)Value是实现了值的union类型。类型nil的值没有显式表示在这个union类型中是因为标签已经足够标识它们。域n用来表示numbers类型(lua_Number默认是double类型)。同样,域b是给booleans类型用的,域p是给轻量级的userdata类型。而域gc是为会被垃圾回收的其他类型准备的((strings, tables, functions, 重量级userdata, threads)

 

使用带标签的union实现lua值的一个后果就是拷贝值的代价稍微昂贵了一点:在一台支持64double类型的32位机器上,TObject的大小是12字节(或者16字节,如果double8字节对齐的话),因此拷贝一个值将需要拷贝3(或者4)个机器字长。尽管如此,想在ANSI C中实现一个更好的值的表示是困难的。一些动态类型语言(例如Smalltalk80的原始实现)在每个指针中使用多余的位来存储值的类型标签。这个技巧在绝大多数机器上正常工作,这是因为一个指针的最后两个或者三个位由于对齐将总是0,所以可以被用作他途。但是,这项技术既不是可移植的也无法在ANSI C中实现,C 语言标准甚至都不保证指针适合任何整数类型,所以没有在指针上操作位的标准方法。

减小值大小的另一个观点就是持有显式标签,从而避免在union中放置一个double类型。例如,所有的number类型可以表示为堆分配的对象,就像String那样。(python使用了这项技术,除了预先分配了一些小的整数值)。尽管如此,这样的表示方法将使语言变的非常缓慢。作为选择,整数的值可以表示位“拆箱式”的值,直接存储在union中,而浮点值放在堆中。这个办法将极大地增加所有算术运算操作的实现复杂度。

类似早期的解释型语言,例如Snobol [11] Icon [10]lua在一个hash表中“拘留”(internalizes)字符串:(hash表)没有重复地持有每个字符串的单独拷贝。此外,String是不可变的:一个字符串一旦被“拘留”,将不能再被改变。字符串的哈希值依据一个混合了位和算术运算的简单表达式来计算,囊括所有的位。当字符串被“拘留”时,hash值保存(到hash表),以支持更快的字符串比较和表索引。如果字符串太长的话,hash函数并不会用到字符串的所有字节,这有利于快速地散列长字符串。避免处理长字符串带来的性能损失是重要的,因为(这样的操作)在lua中是很普遍的。例如,用lua处理文件的时候经常将整个文件内容作为一个单独的长字符串读入内存。

11
3
分享到:
评论
1 楼 ShiningRay 2008-04-09  
好文!请问有没有可供下载的pdf或者doc格式的文件?

相关推荐

    LUA5.0 源代码

    源代码中的`lua.c`和`luac.c`文件包含了虚拟机的实现,包括编译器和解释器部分。通过分析这些代码,我们可以理解LUA如何将源代码转换为高效的字节码,以及字节码如何被解析和执行。 2. **数据结构**:LUA5.0使用了...

    lua 5.0 设计实现

    《Lua 5.0 设计实现》是一本深入解析Lua编程语言核心机制的教程,尤其关注其源代码的实现细节。作为一款轻量级、高效且可嵌入的脚本语言,Lua在游戏开发、系统配置、网络编程等多个领域都有广泛应用。这本书详细介绍...

    lua5.0的实现原理剖析

    3. 闭包的实现:Lua 5.0 支持带作用域的嵌套函数,即函数闭包。闭包在处理局部变量时,仅在变量被嵌套函数引用并超出作用域时,才会将它们移动到堆中。这一实现方式避免了传统堆栈模型中可能出现的问题,增强了代码...

    Lua5.0中文参考

    ### Lua5.0中文参考知识点概述 #### 一、Lua简介 - **Lua**是一种轻量级、高效的脚本语言,被广泛应用于多种场景中,包括游戏开发、Web应用程序及通用脚本处理等。它的设计目标是简洁且功能强大,能够轻松地嵌入到...

    The implementation of lua5.0

    而“新建文本文档 (2).txt”可能是对Lua 5.0实现的补充说明或者示例代码,可能包含了一些具体的应用实例,帮助读者更好地理解如何在实践中运用这些概念。 学习Lua 5.0不仅能够提升你对脚本语言的理解,还能让你掌握...

    Lua 5.0 Reference Manual(Revision 1.0) - ZIP

    本翻译取材于http://www.lua.org/manual/5.0/manual.html,即《Lua 5.0 Reference Manual》之英文原版,在尽可能依照原文内容的前提下对部分艰涩的叙述进行了斟酌,以提高本书的可理解性。 原文部分章节涉及到C语言...

    Lua5.0参考手册.doc

    Lua 5.0 是一种轻量级的、通用的脚本语言,专为支持数据描述机制和一般过程式编程而设计。它具有广泛的语言特性,包括面向对象编程、函数式编程以及数据驱动编程的支持,使其成为强大的配置语言。Lua 语言的实现是一...

    Reference manual for Lua 5.0

    ### Lua 5.0 参考手册知识点概览 #### 一、Lua 5.0 简介 - **版本信息**:本手册为 Lua 5.0 的参考手册,最后一次修订日期为 2003 年 11 月 25 日。 - **版权信息**:该文档由 Tecgraf, PUC-Rio 版权所有,但允许...

    Lua 5.0 Reference Manual(Revision 1.0) - PDF

    ### Lua 5.0 参考手册核心知识点总结 #### 一、绪论与背景介绍 - **Lua语言概述**:Lua是一种轻量级、高效的脚本语言,它以其简洁性和优雅性闻名。Lua的设计原则之一是保持轻巧,这使得它的标准库相比其他脚本语言...

    lua实现机制

    一个重要的例子是Lua5.0版本中引入的协同程序(coroutines),以及在即将到来的Lua5.1版本中实现的增量式垃圾回收机制。这两项功能对于游戏开发尤为重要。 Lua5.0的主要创新包括基于寄存器的虚拟机、用于优化作为...

    lua 5 实现1

    【Lua 5 实现1】文章探讨了 Lua 5.0 的主要改进,这些改进使得 Lua 更加适合工业级应用,特别是在游戏开发领域。以下是详细的知识点解析: 1. **基于寄存器的虚拟机**:传统的虚拟机,如Java虚拟机(JVM),基于堆栈...

    the implementation of lua 5p0

    虽然在给出的部分内容中未明确提及,但Lua 5.0及其后续版本确实实现了增量式垃圾回收。传统的垃圾回收机制可能会导致应用程序在运行过程中出现明显的停顿,而增量式垃圾回收则能够在应用程序运行的同时逐步进行内存...

    lua-5.1.5.0

    `lua-5.1.5.0`是Lua语言的一个版本,发布于2009年,它在Lua 5.1系列中是一个稳定且广泛使用的版本。 1. **语言特性** - **简单语法**:Lua语法简洁明了,基于C语言,但更加面向表达式,使用括号较少,易于阅读和...

    Lua 的实现,Lua使用者不能不看,脚本语言的经典啊。

    ### Lua 5.0 实现的关键特性解析 #### 引言 Lua 作为一种轻量级、高效的脚本语言,自1993年诞生以来,迅速在游戏开发及其他多个行业中得到了广泛应用。它之所以能获得如此高的认可度,很大程度上归功于其设计目标:...

    lua说明pdf版本

    ### Lua 5.0 主要特点详解 #### 一、引言 Lua 作为一种轻量级的...基于寄存器的虚拟机、散列表优化算法、闭包的实现以及协程的引入等技术,共同构成了Lua 5.0的重要组成部分,也为后续版本的发展奠定了坚实的基础。

    cocos2d-lua 实现富文本

    1. **Cocos2d-lua 文本基础** 在 Cocos2d-lua 中,我们可以使用 `cc.Label` 类来创建文本节点。默认情况下,Label 只能显示基本的纯文本,但通过集成特定的富文本库,如 `ccui.TextField` 或 `cc.LabelTTF`,我们...

    所有版本LUA源码

    所有版本LUA源码 lua-5.3.5 lua-5.3.4 lua-5.3.3 lua-5.3.2 lua-5.3.1 ...lua-5.0 lua-4.0.1 lua-4.0 lua-3.2.2 lua-3.2.1 lua-3.2 lua-3.1 lua-3.0 lua-2.5 lua-2.4 lua-2.2 lua-2.1 lua-1.1 lua-1.0

    luaEditor5.0

    luaEditor5.0发布 1. 优化内核,极大提高了调用速度 2. 添加搜索框,智能动态线程搜索,搜索速度很快 3. 高亮标记搜索结果 4. 添加智能是否需要+end功能 5. 利用短点当书签功能 6. 添加设置保存,遗迹可以设置背景色...

    lua设计模式总结

    1、简单工厂模式lua实现 2、工厂方法模式lua实现 3、原型模式lua实现 4、建造者模式lua实现 5、单例模式lua实现 6、抽象工厂模式lua实现 结构型模式 1、装饰模式lua实现 2、代理模式lua实现 3、外观模式lua实现 4、...

    lua编译&反编译,lua反编译工具,Java源码.zip

    Lua的官方工具luac可以实现这一目标。luac将Lua源代码编译为字节码,并写入到一个.lua.out文件中,这是一个二进制文件。预编译后的代码可以更快地加载和执行,因为它避免了运行时的解释过程。 反编译是将已编译的...

Global site tag (gtag.js) - Google Analytics