`
chinamming
  • 浏览: 151287 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

lua指令

 
阅读更多

A No-Frills Introduction to Lua 5.1 VM Instructions

by Kein-Hong Man, esq. <khman AT users.sf.net>

Version 0.1, 20060313

1 Introduction

这是一本关于Lua 5.1虚拟机指令集的完全介绍。与Perl和Python相比,Lua的简洁性使得有人可以一窥它的内幕并理解它的内在实现。如果没有把一个“生物”切开就不可能检查它的内脏,器官和那些令人生厌的平时难得一见的东西,同样的道理,在没有拆分的情况下,任何人都不会完全的理解体会一个脚本语言或是任何复杂的系统。所以想象这篇文档可以帮助您窥探内幕。

这篇介绍性的指南仅仅包含Lua5.1。要得到关于Lua5.0.2虚拟机指令的指导请参考以前的文档。这样做是必要的,因为Lua的内部实现没有任何方面是固定和标准的,所以用户一定不要期望从Lua的一个版本到另一个版本的内部实现具有兼容性。

ChunkSpy (URL:http://luaforge.net/projects/chunkspy/),是我在学习Lua内部实现时编写的一个Lua二进制块反汇编器,这篇文档中的实例都是用ChunkSpy生成的。ChunkSpy简洁的反汇编模式与luac的列表模式的输出十分相似,所以你没有必要去学习新的列表语法。ChunkSpy可以从LuaForge (URL:http://luaforge.net/)下载,它的许可类型与Lua5.1本身的许可类型相同都是MIT类型。

ChunkSpy有一个交互模式:您可以写入源代码块并立即得到反汇编代码。这样这篇文档就可以被看作是一本指南,您可以将例子写入到ChunkSpy并亲自看一看结构。当您在探索Lua代码生成器在为许多小代码片段生成二进制码的行为的时候交互模式是非常有用的。

这只是一个快速的介绍,并不打算对Lua(从这里开始,使用“Lua”代替“Lua5”,除非有特殊说明)虚拟机或指令集做广泛或深入的讨论,只是想成为一个简单的易于消化的初学者指南。-不要做徒劳的事情。

这篇简介的目的是用最少的废话来讨论所有的Lua虚拟机指令集和Lua5二进制块的结构。如果你想得到更多的细节,你可以使用luac或ChunkSpy学习一些非平凡的代码块,或者可以进入Lua源代码本身看看究竟做了什么。

这篇文档目前只是一个草稿,我不是Lua内部实现的专家,所以欢迎意见回馈。如果您发现了任何错误或者想要投稿,请给我发送电子邮件(khman AT

users.sf.netormkh AT pl.jaring.my)使得我可以改正,谢谢。

2 Lua Instruction Basics

我们将要看到了Lua虚拟机指令集是Lua语言的详尽实现。这并不是实现Lua语言的唯一的方法。现在的指令集只不过碰巧是被Lua的作者选来实现Lua。(这一段作者好像是在说Lua的指令集并不是固定的只是因为Lua的作者选择了这样的指令集,如果另一个人要重新实现Lua那么完全有可能使用另一套指令集)接下来的章节是基于Lua 5.1使用的指令集。将来这个指令集有可能会改变-不要期望它一成不变。这是因为虚拟机的实现细节不是大多数脚本语言使用者所关心的。对于大多数程序来说,没有必要指定字节码如何生成,虚拟机任何运转,只要语言像宣传的那样工作就行了。所以记住,没有关于Lua虚拟机指令集的官方的规范,也没有必要。只有Lua语言的官方规范。

在学习Lua二进制块反汇编的过程中,你会注意到许多生成的指令序列并不像您想象中的那么完美。从工程学的观点来看这完全是正常的。标准的Lua实现并不意味着它是一个优化的字节码编译器或是JIT编译器。但它将会快速有效的装载,解析,运行Lua源代码。这些就是这个实现的全部价值。如果您确实需要性能,无论怎样您都将会降低到纯C函数。

Lua指令具有固定大小,通常使用32位无符号整型数据表示。在二进制块中,字节序很重要,一天指令可以很轻松的使用C语言中通常的整数移位和掩码操作来对其进行编码和解码。细节可以在lopcodes.h中找到,同时Instruction类型在llimits.h中定义。

现在Lua 5.1中有三种指令类型和38个操作码(编号从0到37)。指令的类型由iABC, iABx, iAsBx列举出来,下面是更直观的描述:


除了sBx以为,指令使用简单的无符号整型值编码。sBx域可以表示负数,但是不实用二进制补码的形式。取而代之,它有一个bias(*这个词我不知道翻译成什么更好*),这个bias等于sBx的无符号副本Bx能够表示的最大整数值的一半。对于18位的域来说,Bx能够保存的最大整数值是262143,所以bias就是131071(计算262143>>1)。值-1将被编码为(-1 + 131071)或131070或十六进制的0x1FFFE。

域A, B和C通常作为寄存器数(因为它们与处理器的寄存器的相似性,我以后将使用术语“寄存器”)。虽然域A在算术操作中是目的操作数,但是在其他指令中这条规则并不总是正确的。一个寄存器确实也可以是当前栈结构的索引,寄存器0标识栈底位置。

与Lua C API不同,负数索引(从栈顶开始计算)是不被支持的。对于许多指令,栈顶可能是必须的,这时可以使用特殊的值编码,通常使用0。在当前栈中的局部变量的值等于某一寄存器,同时允许读/写全局变量和upvalues的专有指令也是一样。对于许多指令,一个在域B或C中的值有可能是寄存器或是在常量池中的常量索引的编码。在后面关于指令符号的章节中将更深入的描述。

通常,Lua的栈结构的最大值是250。在llimits.h中这个值被定义为MAXSTACK。

栈结构的最大值转换成对每个函数的局部变量的最大值的限制时,这个值被设置成200,在luaconf.h中被定义为LUAI_MAXVARS。在同一个文件中发现的其他的限制包括每个函数的upvalues的最大值(60),被定义为LUAI_MAXUPVALUES,调用深度,最小的C堆栈尺寸,等等。同样,由于sBx包含18位,所以跳转和控制结构不能超过131071的跳转距离。

下面是Lua 5.1的虚拟机指令集的摘要:

3 Really Simple Chunks

在进入二进制块和虚拟机指令的细节之前,这一章简要的示范一下怎样使用ChunkSpy解析Lua 5生成的代码。这篇文档中的所有的例子都是由应用于Lua 5.1的ChunkSpy生成的,这个程序可以在ChunkSpy 0.9.8的发布版本中找到。

首先,以交互模式启动ChunkSpy(用户输入被设置成粗体):

$lua ChunkSpy.lua --interact

ChunkSpy: A Lua 5.1 binary chunk disassembler

Version 0.9.8 (20060307) Copyright (c) 2004-2006 Kein-Hong Man

The COPYRIGHT file describes the conditions under which this

software may be distributed (basically a Lua 5-style license.)

Type 'exit' or 'quit' to end the interactive session. 'help' displays

this message. ChunkSpy will attempt to turn anything else into a

binary chunk and process it into an assembly-style listing.

A '/' can be used as a line continuation symbol; this allows multiple

lines to be strung together.

>

我们将以最简单的程序块开始,它产生的结果如下:

>do end

; source chunk: (interactive mode)

; x86 standard (32-bit, little endian, doubles)

; function [0] definition (level 1)

; 0 upvalues, 0 params, 2 stacks

.function 0 0 2 2

[1] return 0 1

; end of function

ChunkSpy将会把您的键盘输入看作是小的Lua源代码块。首先,库函数string.dump()被用来生成二进制串,然后ChunkSpy反汇编这个串并向您展示一个汇编语言形式的输出列表。

这个列表有一些特点:注释使用“;”开头。二进制块的头部并没有显示在这个简单的列表中。数据或头这样的非指令的信息使用汇编语言标识符的方式显示,就是以点开头。为一些指令生成luac形式的注释,指令的位置显示在方括号中。

一个“do end”块生成了唯一一条RETURN指令,并且什么也没做。它没有参数,局部变量,upvalues和全局变量。对于这篇文档中的其余的反汇编列表,我将省略通用的头注释并仅仅展示函数的反汇编部分。指令使用它的记号位置来引用,例如行[1]。下面是另一个简短的块:

>return

; function [0] definition (level 1)

; 0 upvalues, 0 params, 2 stacks

.function 0 0 2 2

[1] return 0 1

[2] return 0 1

; end of function

为源代码中的每一条return生成一条RETURN指令。第一条RETURN(行[1])是由关键字return生成的,然后代码生成器总是添加第二条RETURN(行[2])。这不是问题,因为第二条RETURN从来不会被运行,所以仅仅浪费了4个字节。完美的RETURN指令的生成需要基本块的分析,但是没有这样做,原因是没有必要在运行时为了一个额外的RETURN浪费性能,而这里仅仅有一个可以忽略的内存浪费。

注意,在下面的例子中,即使堆栈没有被使用,最小的堆栈尺寸也是2。下一个代码片段是将常量值6赋值给全局变量a:

>a=6

; function [0] definition (level 1)

; 0 upvalues, 0 params, 2 stacks

.function 0 0 2 2

.const "a" ; 0

.const 6 ; 1

[1] loadk 0 1 ; 6

[2] setglobal 0 0 ; a

[3] return 0 1

; end of function

所有的字符串和数字常量都被放入每一个函数的池中,指令通过从0开始的索引来引用它们。全局变量名需要使用常量字符串,因为全局变量是作为一个表来维护的。行[1]将值6(使用指向常量池的索引1)装载到寄存器0中,然后行[2]使用常量“a”(常量索引0)作为关键字,使用寄存器0(保存着数值6)作为值来设置全局表。

如果我们将变量写成局部的,会得到:

>local a="hello"

; function [0] definition (level 1)

; 0 upvalues, 0 params, 2 stacks

.function 0 0 2 2

.local "a" ; 0

.const "hello" ; 0

[1] loadk 0 0 ; "hello"

[2] return 0 1

; end of function

局部变量存在于栈中,并且在它们的生存周期内,它们将占据栈(或寄存器)的一个位置。局部变量的作用域由开始的程序计数位置和结束的程序级数位置来指定;作用域没有在简要的反汇编列表中显示。

函数中的局部变量表告诉用户寄存器0就是变量a。这些信息对于虚拟机没有作用,因为虚拟机只需要知道寄存器数----假设代码生成器已经做了适当的寄存器分配。所以,行[1]的LOADK将常量0(字符串“hello”)装载到寄存器0,寄存器0就是局部变量a。不包含调试信息的二进制块不包含局部变量名。

接下来的章节中的一些例子将包含额外的评注,这些注释都包含在括号中。请注意ChunkSpy不会生成这些注释,也不会缩进位于不同嵌套级别的函数。接写来我们看看Lua 5.1的二进制块的结构。

分享到:
评论

相关推荐

    Lua指令操作手册.pdf

    《Lua指令操作手册》是针对LUA语言在台达设备中的应用进行详细解析的手册,由台达电子工业股份有限公司机电商群编写。手册主要内容包括Lua语言简介、基础语法、指令列表以及各指令的详细说明,旨在帮助用户更好地...

    Lua-5.1-虚拟机指令简明手册1

    在“Lua指令基础”章节中,作者解释了Lua程序的基本结构。Lua的指令是二进制格式的,它们构成了Lua程序的基础单元。这些指令控制虚拟机执行各种操作,如变量赋值、函数调用和控制流。 “十分简单的程序块”章节讨论...

    Lua虚拟机指令集介绍

    Lua指令通常由一个操作码和零个或多个操作数组成。操作码定义了指令的基本行为,而操作数则用于指定指令作用的具体对象。Lua虚拟机通过解释这些指令来执行Lua代码。了解这些基本概念是理解Lua虚拟机工作原理的基础。...

    可以运行Lua脚本的串口工具“llcom”

    llcom支持运行Lua脚本、在线编写Lua脚本、加载Lua脚本、串口流控制(DTR、CTS、RTS、DCD)等,功能非常强大

    剑网3的lua事件列表以及中文简介

    剑网3的lua事件列表以及中文简介,例如: SYS_MSG 系统信息触发,例如玩家死亡、升级、系统错误信息、命中、躲闪等 NPC_TALK NPC说话时触发

    lua编程指南

    《Lua编程指南》是一本深入介绍Lua编程语言的书籍,适合所有希望学习和提升Lua技能的读者。Lua是一种轻量级、高效的脚本语言,它以其简洁的语法和强大的扩展能力而闻名。作为一门通用的编程语言,Lua支持过程式编程...

    a-no-frills-introduction-to-lua-5.1-vm-instructions

    1. Lua指令基础,包括真的简单的块(chunks)和Lua二进制块。 2. 指令表示法,这是理解指令格式的关键。 3. 加载常量、上值(upvalues)和全局变量的方法。 4. 表指令,涉及表的创建和操作。 5. 算术和字符串指令,...

    Lua 编译器和迭代器用于在不同的微控制器上运行(如 AVR 8 位)_C语言_代码_相关文件_下载

    目标是 10 MIPS(AVR 为 10 MHz)上的 100 万条 Lua 指令。用法 luac.exe -s -o alltest.luc alltest.lua ChunkSpy.lua alltest.luc alltest.lua -o alltest.lst uLuaPC.exe alltest.luc ChunkSpy.lua - 可选。该...

    A No Frills Intro To Lua51 VM Instructions

    #### 二、Lua指令基础 Lua5.1虚拟机指令集是Lua解释器的核心组成部分,它定义了Lua代码在运行时的行为。这些指令被编译器或解释器转换为字节码,然后由虚拟机执行。Lua5.1的指令集包括一系列用于执行各种操作的基本...

    一个小巧的lua解释器实现

    解释器遍历AST,执行每个节点对应的 Lua 指令,如赋值、函数调用、控制流等。为了实现这些功能,解释器需要维护一个环境(Environment),用于存储变量和函数。 在Lua中,环境是通过表(Table)实现的,这是Lua的...

    键盘按钮对应代码

    标题:“键盘按钮对应代码” 描述:“用笔记本玩小时候游戏机街机要知道的按键设置” 从这份文档中,我们可以深入了解到电脑键盘上各个按键所对应的按键码(Keycode),这对于理解键盘输入、编程控制以及在特定...

    nginx lua.zip

    - ** ngx_lua指令**:在Nginx配置文件中定义Lua脚本的执行,如`lua_code_cache`控制Lua代码缓存,`set_by_lua`、`content_by_lua`等用于执行Lua代码。 - ** ngx.req**对象:提供了对HTTP请求的访问,如获取请求头、...

    LUAC脚本解密_luac解密在线_luac4加密_luac反编译_luac4解密工具_luac解密工具

    这个过程需要用到反编译器,通常这些工具会尝试解析字节码指令,并将其转换回接近原代码的形式。反编译并不总是能够完全恢复原始代码,因为它丢失了源代码的一些元信息,例如注释和变量名。 "luac4解密工具"和"luac...

    LUA程序设计参考文档

    **LUA程序设计参考文档** LUA是一种轻量级、高效、可扩展的脚本语言,广泛应用于游戏开发、嵌入式系统、服务器配置等多个领域。它的语法简洁明了,易于学习,同时提供了丰富的库支持和强大的元编程能力。这份"LUA...

    串口屏LUA教程-自定义串口指令V1.0.pdf

    本文档是一份名为《串口屏LUA教程-自定义串口指令V1.0.pdf》的技术教程,主要面向所有大彩物联型系列产品的使用者,目的是教授如何通过LUA脚本实现自定义串口指令以控制硬件设备如按钮、文本显示和蜂鸣器等。...

    基于串口屏LUA脚本—-自定义串口指令功能配套工程文件

    在本主题“基于串口屏LUA脚本—-自定义串口指令功能配套工程文件”中,我们将深入探讨如何利用LUA脚本自定义串口指令来控制串口屏。 串口屏通常具备以下特性: 1. **串行通信**:串口屏使用RS-232、RS-485或UART等...

    Lua5.1.5-lib库

    13. **lopcodes.c/lopcodes.o**: Lua字节码指令的定义和操作。 14. **lparser.c/lparser.o**: 语法分析器,将标记转化为抽象语法树。 15. **lstate.c/lstate.o**: Lua运行时环境的状态管理。 16. **lstring.c/...

    lua-nginx-module-0.10.13

    配置时,通过`load_module`指令加载模块,然后在合适的上下文中使用`lua`指令插入Lua代码。 3.2 常见指令 - `set_by_lua`: 在配置阶段设置变量。 - `access_by_lua`: 处理请求的访问控制。 - `content_by_lua`: ...

    lua-5.4.2_Win64_bin.zip

    lua.exe读取并解释字节码,执行相应的指令,实现了lua脚本的功能。 在Windows环境中,为了使用这些文件,你需要将包含这三个文件的目录添加到系统路径(PATH环境变量),这样你就可以在任何位置通过命令行启动lua或...

Global site tag (gtag.js) - Google Analytics