- 浏览: 3047705 次
- 性别:
- 来自: 海外
文章分类
- 全部博客 (430)
- Programming Languages (23)
- Compiler (20)
- Virtual Machine (57)
- Garbage Collection (4)
- HotSpot VM (26)
- Mono (2)
- SSCLI Rotor (1)
- Harmony (0)
- DLR (19)
- Ruby (28)
- C# (38)
- F# (3)
- Haskell (0)
- Scheme (1)
- Regular Expression (5)
- Python (4)
- ECMAScript (2)
- JavaScript (18)
- ActionScript (7)
- Squirrel (2)
- C (6)
- C++ (10)
- D (2)
- .NET (13)
- Java (86)
- Scala (1)
- Groovy (3)
- Optimization (6)
- Data Structure and Algorithm (3)
- Books (4)
- WPF (1)
- Game Engines (7)
- 吉里吉里 (12)
- UML (1)
- Reverse Engineering (11)
- NSIS (4)
- Utilities (3)
- Design Patterns (1)
- Visual Studio (9)
- Windows 7 (3)
- x86 Assembler (1)
- Android (2)
- School Assignment / Test (6)
- Anti-virus (1)
- REST (1)
- Profiling (1)
- misc (39)
- NetOA (12)
- rant (6)
- anime (5)
- Links (12)
- CLR (7)
- GC (1)
- OpenJDK (2)
- JVM (4)
- KVM (0)
- Rhino (1)
- LINQ (2)
- JScript (0)
- Nashorn (0)
- Dalvik (1)
- DTrace (0)
- LLVM (0)
- MSIL (0)
最新评论
-
mldxs:
虽然很多还是看不懂,写的很好!
虚拟机随谈(一):解释器,树遍历解释器,基于栈与基于寄存器,大杂烩 -
HanyuKing:
Java的多维数组 -
funnyone:
Java 8的default method与method resolution -
ljs_nogard:
Xamarin workbook - .Net Core 中不 ...
LINQ的恶搞…… -
txm119161336:
allocatestlye1 顺序为 // Fields o ...
最近做的两次Java/JVM分享的概要
之前有同学在做龙书(第二版)题目,做到8.4的练习,跟我对答案,然后聊起C语言的for循环的代码生成有几种常见的模式。顺道跟大家分享讨论一下。
C语言的for循环大家应该都很熟悉了,C系语言大都有一样或几乎一样的语法结构:一个循环初始化,一个循环条件,一个循环再初始化,然后一个循环体。通常循环初始化在最前面,再初始化的逻辑直接黏在循环体后面,能有变化的就是循环条件的代码生成到什么位置。
举个例子,
把它翻译为龙书第8章所用的三地址指令,可以用许多不同的模式翻译,这里举三种例子:
(注释里标出了基本块的标号、前导基本块、后继基本块,以及基本块的内容等信息。应该很直观吧?)
第一种:循环条件放前面,循环末尾用无条件跳转回到开头:
第二种:循环条件放后面,在进入循环的地方先无条件跳转到位于循环末尾的条件:
第三种:在进入循环的地方先判断是否跳过循环,然后循环条件放在末尾:
顺带一提,这个具体例子中循环条件是拿循环变量与一个编译时常量比较,所以这个版本的代码的(2)可以非常轻易的通过条件常量传播消除掉,等价变换为:
而前两种模式没那么容易消除其中的指令。
有兴趣的同学可以来讨论下这几种模式的异同点
注意三地址指令的条数,基本块的个数与划分,基本块之间控制流边的总个数,代码的静态与动态的情况的关系,等等。
当然这不是啥新问题,早就有很多论文讨论过了。
例如说某篇1978年的小论文⋯名字就先不说了免得剧透。有兴趣的同学自己思考喔。
========================================
下面补充些在实际生活种能看到的例子。
1. Java虚拟机规范,Java SE 7版,3.2小节
这里举了几个Java的for循环翻译为字节码的范例,都符合上面说的“第二种”模式。
例如把这样的代码:
翻译为:
Eclipse Compiler for Java (ecj)就采取了这种模式。但Oracle JDK6里自带的javac实际用的代码生成策略却是前面说的“第一种”,将上面的例子编译为:
好玩吧呵呵厚⋯
C语言的for循环大家应该都很熟悉了,C系语言大都有一样或几乎一样的语法结构:一个循环初始化,一个循环条件,一个循环再初始化,然后一个循环体。通常循环初始化在最前面,再初始化的逻辑直接黏在循环体后面,能有变化的就是循环条件的代码生成到什么位置。
举个例子,
for (int i = 0; i < 100; i++) { foo(); }
把它翻译为龙书第8章所用的三地址指令,可以用许多不同的模式翻译,这里举三种例子:
(注释里标出了基本块的标号、前导基本块、后继基本块,以及基本块的内容等信息。应该很直观吧?)
第一种:循环条件放前面,循环末尾用无条件跳转回到开头:
// B0 -> B1: loop initialize (1) i = 0 // B1 <- { B0, B2 }, -> { B2, B3 }: loop condition (2) if i >= 100 goto (6) // note: inverted condition // B2 <- B1, -> B1: loop body (3) call foo() (4) i = i + 1 (5) goto (2) // B3 <- B1: after loop (6) ...
第二种:循环条件放后面,在进入循环的地方先无条件跳转到位于循环末尾的条件:
// B0 -> B2: loop initialize (1) i = 0 (2) goto (5) // B1 <- B2, -> B2: loop body (3) call foo() (4) i = i + 1 // B2 <- { B0, B1 }, -> { B1, B3 }: loop condition (5) if i < 100 goto (3) // B3 <- B2: after loop (6) ...
第三种:在进入循环的地方先判断是否跳过循环,然后循环条件放在末尾:
// B0 -> { B1, B3 }: loop initialize (1) i = 0 (2) if i >= 100 goto (6) // note: inverted condition // B1 <- { B0, B2 }, -> B2: loop body (3) call foo() (4) i = i + 1 // B2 <- B1, -> { B1, B3 }: loop condition (5) if i < 100 goto (3) // B3 <- { B0, B2 }: after loop (6) ...
顺带一提,这个具体例子中循环条件是拿循环变量与一个编译时常量比较,所以这个版本的代码的(2)可以非常轻易的通过条件常量传播消除掉,等价变换为:
// B0 -> B1: loop initialize (1) i = 0 // B1 <- { B0, B2 }, -> B2: loop body (2) call foo() (3) i = i + 1 // B2 <- B1, -> { B1, B3 }: loop condition (4) if i < 100 goto (2) // B3 <- { B0, B2 }: after loop (5) ...
而前两种模式没那么容易消除其中的指令。
有兴趣的同学可以来讨论下这几种模式的异同点
注意三地址指令的条数,基本块的个数与划分,基本块之间控制流边的总个数,代码的静态与动态的情况的关系,等等。
当然这不是啥新问题,早就有很多论文讨论过了。
例如说某篇1978年的小论文⋯名字就先不说了免得剧透。有兴趣的同学自己思考喔。
========================================
下面补充些在实际生活种能看到的例子。
1. Java虚拟机规范,Java SE 7版,3.2小节
这里举了几个Java的for循环翻译为字节码的范例,都符合上面说的“第二种”模式。
例如把这样的代码:
void spin() { int i; for (i = 0; i < 100; i++) { ; // Loop body is empty } }
翻译为:
0: iconst_0 // Push int constant 0 1: istore_1 // Store into local variable 1 (i=0) 2: goto 8 // First time through don't increment 5: iinc 1, 1 // Increment local variable 1 by 1 (i++) 8: iload_1 // Push local variable 1 (i) 9: bipush 100 // Push int constant 100 11: if_icmplt 5 // Compare and loop if less than (i < 100) 14: return // Return void when done
Eclipse Compiler for Java (ecj)就采取了这种模式。但Oracle JDK6里自带的javac实际用的代码生成策略却是前面说的“第一种”,将上面的例子编译为:
0: iconst_0 1: istore_1 2: iload_1 3: bipush 100 5: if_icmpge 14 8: iinc 1, 1 11: goto 2 14: return
好玩吧呵呵厚⋯
发表评论
-
The Prehistory of Java, HotSpot and Train
2014-06-02 08:18 0http://cs.gmu.edu/cne/itcore/vi ... -
MSJVM and Sun 1.0.x/1.1.x
2014-05-20 18:50 0当年的survey paper: http://www.sym ... -
Sun JDK1.4.2_28有TieredCompilation
2014-05-12 08:48 0原来以前Sun的JDK 1.4.2 update 28就已经有 ... -
IBM JVM notes (2014 ver)
2014-05-11 07:16 0Sovereign JIT http://publib.bou ... -
class data sharing by Apple
2014-03-28 05:17 0class data sharing is implement ... -
Java 8与静态工具类
2014-03-19 08:43 16273以前要在Java里实现所谓“静态工具类”(static uti ... -
Java 8的default method与method resolution
2014-03-19 02:23 10450先看看下面这个代码例子, interface IFoo { ... -
HotSpot Server VM与Server Class Machine
2014-02-18 13:21 0HotSpot VM历来有Client VM与Server V ... -
Java 8的lambda表达式在OpenJDK8中的实现
2014-02-04 12:08 0三月份JDK8就要发布首发了,现在JDK8 release c ... -
GC stack map与deopt stack map的异同
2014-01-08 09:56 0两者之间不并存在包含关系。它们有交集,但也各自有特别的地方。 ... -
HotSpot Server Compiler与data-flow analysis
2014-01-07 17:41 0http://en.wikipedia.org/wiki/Da ... -
基于LLVM实现VM的JIT的一些痛点
2014-01-07 17:25 0同事Philip Reames Sanjoy Das http ... -
《自制编程语言》的一些笔记
2013-11-24 00:20 0http://kmaebashi.com/programmer ... -
字符串的一般封装方式的内存布局 (1): 元数据与字符串内容,整体还是分离?
2013-11-07 17:44 22389(Disclaimer:未经许可请 ... -
字符串的一般封装方式的内存布局
2013-11-01 12:55 0(Disclaimer:未经许可请 ... -
关于string,内存布局,C++ std::string,CoW
2013-10-30 20:45 0(Disclaimer:未经许可请 ... -
Java的instanceof是如何实现的
2013-09-22 16:57 0Java语言规范,Java SE 7版 http://docs ... -
struct做参数不能从寄存器传?
2013-08-28 23:33 0test test test struct Foo { i ... -
oop、klass、handle的关系
2013-07-30 17:34 0oopDesc及其子类的实例 oop : oopDesc* ... -
Nashorn各种笔记
2013-07-15 17:03 0http://bits.netbeans.org/netbea ...
相关推荐
《第七章 语义分析的中间代码生成》 在编译器设计中,语义分析是将源程序转化为机器可理解形式的关键阶段。本章主要探讨的是如何在语义分析阶段生成中间代码,这是一种便于优化和目标代码生成的抽象表示。中间代码...
《编译原理》课程设计报告书是对FOR循环语句翻译程序设计的一份详细说明,旨在深化学生对编译原理的理解,包括语法分析、语义分析和中间代码生成。以下是报告书涉及的关键知识点: 1. **编译原理基础**:课程设计...
综上所述,"编译原理词法语法分析c语言程序"涵盖的内容从源代码的读取开始,经过词法分析、语法分析、语义分析、优化、代码生成,直至形成最终的可执行文件。这一系列过程是理解和构建编译器的基础,也是开发者深入...
在C语言中,这些元素包括但不限于`int`、`for`(关键字)、`myVar`(标识符)、`34`(整型常量)、`+`和`-`(运算符)。词法分析器通常通过正则表达式或者有限状态自动机来识别这些模式。 在Java中实现C语言的词法...
逗号运算符在C语言中可以用于分隔变量列表,表达式组合,以及在for循环中控制流程。 练习中还涉及到前后文无关文法和语言,这是编译原理中的重要概念,用于描述语言的结构。例如,给定的文法可以生成特定类型的字符...
这个任务旨在帮助你深入理解编译器的工作原理,掌握词法分析、语法分析、语义分析以及代码生成等关键步骤。 1. **词法分析**: 词法分析是编译器的第一步,它的任务是将源代码分解成一系列的标记(token)。对于...
总结来说,PL0编译器是一个用于理解和转换PL0源代码的程序,其设计和实现涉及多个阶段,包括词法分析、语法分析、语义分析、中间代码生成以及目标代码生成。虽然PL0语言简单,但它提供了一个理解编译器工作原理的...
这一过程涉及到词法分析、语法分析、语义分析、中间代码生成、代码优化以及目标代码生成等多个步骤。 2. **重要性**:掌握编译原理对于软件开发人员来说至关重要,它不仅能够帮助开发者更好地理解程序运行的底层机制...
它支持标准C89规范,提供了基本的输入输出函数(如`printf`和`scanf`)、控制结构(如`if...else`,`for`,`while`循环)、数组、指针、函数等核心概念的实践平台。通过它,学生可以直观地理解这些概念,并在实践中...
3. **语法**:类Pascal语言的语法结构包括声明部分(变量、常量、类型定义等)、程序块、函数和过程声明以及控制结构(如if-then-else, for循环,while循环)。了解这些语法元素的组合规则对创建有效的解析器至关...
8.6.3 for循环语句 8.6.4 出口语句 8.6.5 goto语句 8.6.6 过程调用的四元式产生 8.7 说明语句的翻译 8.7.1 简单说明语句的翻译 8.7.2 过程中的说明 8.8 数组和结构的翻译 8.8.1 数组说明和数组元素的引用 8.8.2 结构...
总之,C语言的词法分析器是编译过程中的重要环节,它负责识别并分类源代码中的常数、字符和关键字,为后续的语法分析和代码生成奠定了基础。理解和掌握词法分析器的工作原理对于编程和编译器设计来说至关重要。
在PL的扩展中,可以考虑添加更灵活的匹配规则,如支持范围匹配或模式匹配,这需要设计新的语法和语义规则,并在解析和代码生成阶段进行相应处理。 8. **源代码结构**:压缩包中的`src`目录可能包含了实验的源代码,...
词法分析器通常使用正则表达式来定义单词记号的模式,通过扫描源代码生成单词记号流。 接下来是语法分析,它将单词记号流转化为抽象语法树(AST)。PL0语言的扩展可能涉及新的语句结构或表达式。比如,引入条件语句...
综上所述,“2013广工编译原理试题”所涵盖的知识点包括但不限于编译器的基本概念、编译过程、文法与自动机理论、符号表管理、错误处理以及目标代码生成与优化等方面。这些知识点构成了编译原理的核心内容,对于理解...
这本书可能详细介绍了词法分析、语法分析、语义分析、优化和目标代码生成等编译过程,对理解C和C++程序的底层工作原理有很大帮助。 7. **C.参考大全第四版.PDF**:C语言参考大全是C程序员必备的工具书,它提供了...
C语言编译器的构建涉及多个阶段,包括词法分析、语法分析、语义分析、中间代码生成、优化以及目标代码生成。在这些阶段中,Flex和Bison主要负责前两步,为后续的编译过程奠定基础。 1. **词法分析**:Flex根据预...