`
deepfuture
  • 浏览: 4393443 次
  • 性别: Icon_minigender_1
  • 来自: 湛江
博客专栏
073ec2a9-85b7-3ebf-a3bb-c6361e6c6f64
SQLite源码剖析
浏览量:79996
1591c4b8-62f1-3d3e-9551-25c77465da96
WIN32汇编语言学习应用...
浏览量:69872
F5390db6-59dd-338f-ba18-4e93943ff06a
神奇的perl
浏览量:103187
Dac44363-8a80-3836-99aa-f7b7780fa6e2
lucene等搜索引擎解析...
浏览量:285225
Ec49a563-4109-3c69-9c83-8f6d068ba113
深入lucene3.5源码...
浏览量:14989
9b99bfc2-19c2-3346-9100-7f8879c731ce
VB.NET并行与分布式编...
浏览量:67432
B1db2af3-06b3-35bb-ac08-59ff2d1324b4
silverlight 5...
浏览量:32019
4a56b548-ab3d-35af-a984-e0781d142c23
算法下午茶系列
浏览量:45921
社区版块
存档分类
最新评论

Coco/R快速编译器生成

阅读更多

Coco/R 更Cool些,Coco/R 使用增强的 EBNF 文法建立递归下降分析的分析器(Recursive Descent Parser)和扫描器(Scanner)。Coco/R 除了提供调用分析器的主程序模块之外,还提供语义(semantic )模块在文法之中调用(如,符号表处理和代码生成器),可以直接在grammer 内写语意动作【用你自己喜欢的语言。俺是中意Delphi】。

Coco/R (Cocol/R) 的输入语言基于属性文法, 属性文法是由Knuth 作为一种上下文无关的形式化语义语言引入的。
最初编译器完成的分析是静态语义分析如(C语言)。它们描述没有给定顺序的符号属性之间的依赖性, 它们包括构造符号表、记录声明中建立的名字的含义、在表达式和语句中进行类型推断和类型检查以及在语言的类型规则作用域内判断它们的正确性。当时的许多编译器都使用这样的静态语义分析。

Coco/R 是对Coco [ReM?89]版本的增强。它们之间的主要不同在于Coco/R 使用了递归下降分析代替表驱动方式的分析。Coco/R 集成扫描器和分析器描述,避免了在创建的部分之间接口的问题。

http://www.ssw.uni-linz.ac.at/coco/是它的主页
之前我第一个版本的 SqlBroker 是用 VB6 手写词法分析和语法分析器的, 感谢老外写的那本编译原理, 之前看国人的教材,愣是看了和没看没什么区别, 到了 Persistore 的时候,决定重写 SqlBroker,因为C#下还是有些从 Java 移植过来的 Parser Generator 的,于是我找啊找,比较了几个,最后选择了 Coco/R,主要原因是它不用引用额外的 DLL,而且语法很易学,例子也够多,SQL 的也有一个,便于我抄袭。

彼时Antlr也看到了,但其语法实在是有点复杂,Options 就一堆,有点晕,现在 Persistore 因为其复杂性已经被我遗弃了,但 SqlBroker 仍然是一个非常有价值的东西被我用到新的持久层--ObjectDataSet上了,因为 Coco/R对LL(K)的冲突解决并不好,必须加入额外的函数进行 nexttoken 读取并处理,所以我现在准备把 SqlBroker 的语法分析使用 Antlr 来实现。

这几天学习了一下 Antlr的语法(有时候想,这种 Parser Generator 真是好,可以实现自编译,像 Coco/R 本身的 grammer 文件的 parse 就是用它自己生成的 Parser去完成的,这样可以一直递归优化),感觉确实很强大,怪不得成了 java 世界里最流行的不二选择,C# 版本也有,不过命令行工具仍然是调用jar来完成的。

Coco/R 虽然不够 Antlr 强大,但它确实有它的独门利器,举个例子:

COMMENTS FROM "/*" TO "*/"
COMMENTS FROM "--" TO eol

IGNORE eol + cr + tab


换成Antlr,就麻烦多了:

protected
ML_COMMENT
:"/*"
({ LA(2)!='/' }? '*'
|'\n' { newline(); }
|~('*'|'\n')
)*
"*/"
{ $setType(Token.SKIP); }
;

看到没,必须用$setType来标明这个Token不会进入parser,只要碰到符合此条件的,就一律跳过。还有,Coco/R 可以很方便地支持像 python 那种缩进式的语法分析,不过具体如何弄我忘了。Antlr 也有 Python 语法文件,具体如何处理我还不是很清楚。

Coco/R 我用的时间比较长,简单易学,可以很快上手,但对于一些复杂的语法有点力不从心,而 Antlr 很强大,整个社区也很活跃,相比之下,Coco/R 的圈子要小得多,以前我用的一个版本对于 String 的 Scan 会有一个问题,我是发邮件给作者的,不过作者很快就回信了并给出了对应的修复手法,很PF并感谢他。

在初步使用 Antlr 的过程中,碰到一些小麻烦,比如说:
Parser 必须为小写字母开头,Lexer 必须大写开头(不知这样原因何在)
对于参数的定义及初始化,初始化要写在 Assignment 的前面,因为 Assignment 会在 try 内执行的

附上一个简单的 parser (只能处理 select a,b,c....),通过这个例子,我主要是学习了Antlr 的 Lexer 定义,参数使用,基本上对我移植SqlBroker无障碍了。

class SQLParser extends Parser;
options
{
exportVocab = SQL;
buildAST = false;
k = 2;
}
ansisql
returns [Node parent]
{parent = new Node();}
:
SELECT fieldlist[parent] EOF
;

fieldlist
[Node parent]
{Node f = new Node();}
:
f = field
{parent.next = f;}
(COMMA fieldlist[f])*
;

field
returns [Node node]
{node = new Node();}
:
id :ID
{node.value = id.getText();}
;
coco\r是一个类似于YACC/LEX功能的语言编写工具。
根据例子,对着葫芦画瓢,测试了一个计算器程序。
计算器的ATG:

---------------------------------------------------------------------------------------------------------------
COMPILER calc


CHARACTERS
digit = "0123456789".
cr = '\r'.
ln = '\n'.
tab = '\t'.

TOKENS
number=digit{digit}['.'{digit}].

COMMENTS FROM "//" TO cr ln
IGNORE cr+ln+tab

PRODUCTIONS

OPERAND<out double val>
= (. val=0;.)
(
number (. val = Double.Parse(t.val);
.)
|"(" EXPR<out val> ")"
).

EXPR10<out double val>
= (. bool neg=false; .)
{
('-' (. neg=!neg; .)
|'+' (. .)
)
}
OPERAND<out val> (. if(neg) val*=-1; .)
.

EXPR09<out double val>
=
EXPR10<out val>
{ (. double val2; .)
('*'
EXPR10<out val2> (. val*=val2; .)
|'/'
EXPR10<out val2> (. val/=val2; .)
)
}
.

EXPR<out double val>
=
EXPR09<out val>
{
('+'
EXPR09<out val2> (. val+=val2; .)
|'-'
EXPR09<out val2> (. val-=val2; .)
)
}
.
calc
=
EXPR<out result>.
END calc.

需要的Ubuntu工具包:
mono-gmcs coco-cs

编译过程:
1、编写ATG文件
2、产生Parser和Scanner文件
cococs -frames /usr/share/coco-cs calc.TAG
3、编写调用程序:

----------------------------
using System;

public class Calc{
public static void Main(String[] args){
Parser parser=new Parser(new Scanner("calc.test"));
parser.Parse();
Console.WriteLine(parser.result);
}
}
----------------------------

用mono编译以前,需要手工调节一下Parser.cs的内容:
添加两行:
1、在Parser类里面添加:
public double result=0;
2、在Parser的EXPR方法里面添加:
double val2;

3、用mono编译
gmcs *.cs

4、测试,编写一个calc.test文件,内容譬如
3*12+1

5、运行
mono calc.exe
输出结果:
37

如果测试运算比较复杂,可以用bc来检验一下结果,输入:
less calc.test | bc

应该没有问题。

全部代码下载:这里

另外mono产生的calc.exe文件,可以直接在有.Net Framework 2.0环境的Windows下面运行。
mono感觉还是非常不错的!赞一个。
分享到:
评论

相关推荐

    coco/r 的官方资料

    Coco/R 提供的正是这两部分的生成器,帮助开发者快速搭建编译器的基础框架。 三、Coco/R特性 1. 定义语法:Coco/R 使用类似EBNF(扩展巴科斯范式)的语法定义,直观易懂,方便编写和维护。 2. 自动错误处理:在...

    Coco/S Parser Generator:基于Coco / R的解析器生成器-开源

    Coco / S是一个编译器生成器,它采用纯EBNF语法文件并具有SAX样式回调API。 它是用Java编写的,并针对输入语法所描述的语言生成了Java扫描器(Lexer)和解析器。 Coco / S是Coco / R for Java的2010/11版本的分支。 ...

    coco/R lex和yacc类似功能的c#版本

    【描述】:“coco/R”是一个开源项目,它为C#编程语言提供了类似于lex和yacc的工具,用于词法分析和语法分析。这个项目的目标是为C#开发者提供一套完整的解析器生成器,帮助他们构建编译器、解释器或者任何需要处理...

    coco-r-cpp:我的C ++ CocoR编译器生成器镜像

    **Coco/R C++ 编译器生成器详解** Coco/R 是一款强大的源代码到源代码的编译器生成器,主要用于创建词法分析器(lexer)和语法解析器(parser)。它由挪威科技大学的 Kåre Nymark 开发,支持多种编程语言,包括C、...

    simple-compiler:使用CocoR编译器生成器创建的简单编译器前端

    编译器使用Coco / R编译器生成器实现,该生成器在给定属性语法,符号表和代码生成器的情况下,生成带有递归下降解析器的编译器。 通过使用/ easy / tests /和/ hard / tests /中的测试输入文件来测试编译器。 执行...

    Coco/R Plugin for NetBeans-开源

    这个NetBeans插件在NetBeans IDE中增加了对Coco / R的支持。 Coco / R是一个编译器生成器,它采用属性语法,并为语法描述的语言提供扫描程序和解析器。

    coco-r-oberon:可可·奥伯龙

    Coco/R 是一个编译器生成器,它采用源语言的属性语法并为该语言生成扫描器和解析器。 扫描仪作为确定性有限自动机工作。 解析器使用递归下降。 LL(1) 冲突可以通过多符号前瞻或语义检查来解决。 因此,对于任意 k,...

    language-cocor:CocoR 的 Atom 语法支持

    这对于编写和调试Coco/R语法的解析器和编译器源代码至关重要,因为它可以帮助开发者快速定位潜在错误和提高代码质量。 文件名称“language-cocor-master”表明这是该插件的主分支,通常包含最新或最稳定的代码版本...

    Sentence-Generator:创建表达序列和选项的给定语言的所有句子

    该软件建立在编译器生成器 Coco/R ( ) 之上。 您还可以在此处找到 Coco/R 所需的文件(.atg 和两个 .frame 文件)。 语法使用“ |” 来描述替代品,“[ .. ]”来描述可选元素。用法 var generator = new Generator...

    CocoDelphiIDE-开源

    Coco/R是一种强大的语法定义工具,它允许开发者使用类似EBNF(扩展巴科斯范式)的语法来定义自己的语言,并自动生成Delphi代码,用于解析和处理这种自定义语言。这一过程极大地简化了编译器和解析器的构建,使得...

    编译原理实验,对PL0进行简单的扩充

    这个实验不仅涉及理论知识,还包括实践技能,如编写词法分析器和语法分析器(通常使用工具如LEX和YACC,或现代的ANTLR、Coco/R等),以及理解和生成目标代码。完成这个实验后,你将对编译器的各个阶段有更深的理解,...

    python面试题目-python-python经典面试题目-Python语言的基本概念-常用的功能和特性-编程范式-面试题目

    Python是一种高级编程语言,以其简洁明了的语法和强大的功能深受开发者喜爱。在面试中,了解和掌握Python的基础概念和特性至关重要。以下是一些关键知识点的详细解释: 1. **列表(List)与元组(Tuple)的区别**:...

    py-faster-rcnn-master

    4. 编译Caffe:使用CMake生成Visual Studio解决方案,然后编译生成.sln文件,确保编译成功生成.lib和.dll文件。 5. 链接Python接口:将编译好的Caffe库文件添加到Python的搜索路径中,以便Py-Faster-RCNN可以找到并...

    使用TensorFlow Object Detection API 进行实时目标检测(基于SSD模型).zip

    1. **环境配置**:首先确保安装了Python、TensorFlow、Numpy、PIL等基础库,并设置好TensorFlow Object Detection API的开发环境,包括安装protobuf编译器,克隆API仓库到本地。 2. **数据准备**:收集和标注图像...

    Research-Project:物体检测机器人的研究项目。 2021年Spring开始

    它能够生成特定于平台的构建文件,如Unix的makefile或Windows的Visual Studio项目文件,使得开发者能够在多种操作系统和编译器环境下无缝地构建代码。在物体检测机器人的项目中,CMake可以帮助我们组织和管理项目的...

Global site tag (gtag.js) - Google Analytics