D Parser 之前（二）：汇编编译器

全部 Ruby Python PHP Flash C++ .net Rails Flex C C# Django

浏览 2609 次

锁定老帖子主题：D Parser 之前（二）：汇编编译器精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
梁利锋等级: 初级会员性别: 文章: 1 积分: 42 来自: 北京	发表时间：2008-01-08 相关推荐: 消失：玩具编译器，用于一种名为Gone的虚构类似Go的语言第六章：汇编编译器 flatcc：C语言中用于C的FlatBuffers编译器和库 compiler:基本C编译器（用python编写）盐水：用Rust编写的AC编译器，着重于良好的错误消息更多相关推荐 C++ 　　在《D Parser 之前：写一个简单的虚拟机》里，其中计算 1 到 100 之和的程序 add.bin，是使用十六进制编辑器直接编辑出来的。虚拟机制作完后，考虑了一下，如果直接写 Z 的编译器，难度还是不小，所以决定，先写一个汇编语言的编译器，实现从汇编代码到机器代码的编译工作。　　大体来说，汇编编译基本上是一条一条对照生成，不过，行号的需求使得其中多了一些复杂性，另外，我还决定加入注释的支持。所以，这也是一个比较好的机会实践一下分析器生成器的使用。　　汇编语言部分做了少量修改，over 改为 end，行号改为加 @ 前缀，完成的 Grammatica 的分析文件如下： %header% GRAMMARTYPE = "LL" DESCRIPTION = "A asm grammar for zvm." AUTHOR = "Lephone Liang" VERSION = "1.0" DATE = "7 January 2008" LICENSE = "." COPYRIGHT = "Copyright (c) 2008 Lephone. All rights reserved." %tokens% EAX = "eax" EBX = "ebx" ESP = "esp" EIP = "eip" SET = "set" MOV = "mov" TJMP = "jmp" ADD = "add" TGT = "gt" TGTEQ = "gteq" TEQ = "eq" TNOT = "not" IF = "if" TOUT = "out" TEND = "end" POINT = "" COMMA = "," NUMBER = <<(-)?([0-9])+>> LABEL = <<@[a-z]+>> COMMENT = <<;[^\n\r][\r\n]>> %ignore% WHITESPACE = <<[ \t\n\r]+>> %ignore% %productions% Expression = Atom [Expression]; Atom = SetEax \| MovEax8Esp \| SetEbx \| MovEbx8Esp \| Mov8EspEax \| Mov8EspEbx \| AddEsp \| AddEaxEbx \| Gt \| Gteq \| Eq \| Not \| IfEaxJmp \| Jmp \| Out \| End \| LineLabel ; SetEax = SET EAX COMMA NUMBER; MovEax8Esp = MOV EAX COMMA POINT ESP; SetEbx = SET EBX COMMA NUMBER; MovEbx8Esp = MOV EBX COMMA POINT ESP; Mov8EspEax = MOV POINT ESP COMMA EAX; Mov8EspEbx = MOV POINT ESP COMMA EBX; AddEsp = ADD ESP COMMA NUMBER; AddEaxEbx = ADD EAX COMMA EBX; Gt = TGT; Gteq = TGTEQ; Eq = TEQ; Not = TNOT; IfEaxJmp = IF EAX TJMP LABEL; Jmp = TJMP LABEL; Out = TOUT EAX; End = TEND; LineLabel = LABEL; 　　生成代码后，加入新建的 ZasmC 工程，参照 Grammatica 的例子调试了一会儿，增加一些处理代码后，编译器可以正常工作了。用它编译上一次的的 1 到 100 和的汇编代码，发现几个汇编代码的格式错误后，编译成功，加载入虚拟机，运行得到结果：5050。　　还想再写一个程序验证一下，Fibonacci 序列是一个不错的例子，于是编写 d 的原型如下： import std.stdio; static void main(char[][] args) { int i=0; int a=1; write(a); int b=1; write(b); int t; next: t = a + b; write(t); a = b; b = t; i++; if(i<10) goto next; } void write(int n) { writefln("%d", n); } 　　改写为汇编代码如下： ; 斐波那契 ; esp i, esp+4 a, esp+8 b, esp+12 t ; int i=0; set eax, 0 mov esp, eax ; int a=1; ; write(a); set eax, 1 add esp, 4 ; a mov esp, eax out eax ; int b=1; ; write(b); add esp, 4 ; b mov esp, eax out eax add esp, -8 ; i ; int t; @next ; t = a + b; ; write(t); add esp, 4 ; a mov eax, esp add esp, 4 ; b mov ebx, esp add eax, ebx add esp, 4 ; t mov esp, eax out eax ; a = b; ; b = t; add esp, -4 ; b mov eax, esp add esp, -4 ; a mov esp, eax add esp, 8 ; t mov eax, esp add esp, -4 ; b mov esp, eax ; i++; add esp, -8 ; i mov eax, esp set ebx, 1 add eax, ebx mov esp, eax set ebx, 10 ; 循环次数 gteq not if eax jmp @next end 　　用 ZasmC 编译，生成 Fibonacci.bin，加载到虚拟机，第一次运行错误，后来发现是 d 转汇编的时候的疏忽，修正汇编代码后，编译，加载运行，得到正确的结果。　　下一步就是写 Z 的编译器了，这一步可能要花比较长的时间，准备把 Z 编译成汇编代码，然后再用这个汇编编译器编译成机器代码，这样，Z 编译器就不需要处理行号问题了。　　下面是虚拟机和汇编编译器的源代码，以及运行 Fibonacci 的截图： ZLan.zip (112.7 KB) 描述: 虚拟机和汇编编译器源代码下载次数: 36 描述: Fibonacci 运行截图大小: 13.2 KB 查看图片附件声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

论坛首页 → 编程语言技术版

跳转论坛: