五分钟入门antlr
引言
我在设计一个规则产品引擎中,使用了antlr(一个开源组件)对规则脚本进行编译为java 对象。这样业务人员在规则脚本中,只要关注业务逻辑就可以了。
Antlr = ANother Tool for Language Recognition
Antlr机理
定义语法
定义我这个语言是什么样子的。
Hello world
|
下面的一个陈述句,只有主谓宾三部分,
主语是代词,My|your|his 三选一,加上‘age’,
谓语是is,
宾语是数字,定义的语法:
语法文件Age.g:
grammar Age;
ageSentence:
WHOSE 'age' 'is' INT
WHOSE:
'My'|'your'|'his'
;
INT:
('0'..'9')+;
// white space
WS : (' '|'\r'|'\t'|'\u000C'|'\n')+ {skip();};
那么 My age is 40 是语法正确,My name is 40则是语法错误。
定义动作
语法识别出来后,作些什么,使用{}将动作括起来
Hello world
|
语法文件Age.g:
grammar Age;
ageSentence:
WHOSE 'age' 'is' INT
l {
n Sentence ju = new Sentence();
n ju.zhu=$WHOSE.text+" age";
n ju.wei = "is";
n ju.bin=$INT.text;
n System.out.println(ju.toString());
l };
WHOSE:
'My'|'your'|'his'
;
INT:
('0'..'9')+;
// white space
WS : (' '|'\r'|'\t'|'\u000C'|'\n')+ {skip();};
课堂笔记
|
由此可见,定义动作的作用就是将一大堆文字转换为一大堆 java 实例
课堂提问
|
涉及到计算引擎的:我的一个规则脚本会对每一笔交易流水,都要重新进行语法解析,以便形成java 实例么?
不是。在初始化阶段,对规则脚本进行语法解析,形成java 实例,因为这个脚本不变,所以解析出的java 实例可以反复使用,只是对每笔业务交易,给这些实例注入不同的交易数据而已。
根据语法文件生成java解析类
Set CLASSPATH=%CLASSPATH%; <你的antlr-3.2.jar文件>
java org.antlr.Tool Age.g
会生成 AgeParser.java等文件
运行片段
文件Test.java:
import org.antlr.runtime.*; public class Test { public static void main(String[] args) throws Exception { // create a CharStream that reads from standard input ANTLRInputStream input = new ANTLRInputStream(System.in); // create a lexer that feeds off of input CharStream AgeLexer lexer = new AgeLexer(input); // create a buffer of tokens pulled from the lexer CommonTokenStream tokens = new CommonTokenStream(lexer); // create a parser that feeds off the tokens buffer AgeParser parser = new AgeParser(tokens); // begin parsing at rule r parser.ageSentence(); } }
|
编译:
Javac *.java
运行:
java Test
输入:
his age is 18
^Z
输出:
the sentence 主: his age 谓语: is 宾语: 18
用途
任何需要处理文本的场合
课堂思考
|
关于xml
也可以把xml当做一种语言,写个xml的语法(相当于xml的结构定义dtd,xsd),就可以对xml进行解析了。
如
<project>
{
This.project = new Project();
This.rules = new ArrayList();
}
<rule>
{
Rule r = new Rule();
}
…
</rule>
{
This.rules.add(r);
}
</project>
但一般来说,xml作为一种结构严格的数据较为合适,作为语言,也可以使用类似自然语言的写法,如:
This is a project
{
This.project = new Project();
This.rules = new ArrayList();
}
,It has a rule
{
Rule r = new Rule();
This.rules.add(r);
}
…
延伸阅读
这里仅抛砖引玉,若要进一步了解antlr,
访问官网 www.antlr.org
书籍:
The Definitive Antlr Reference: Building Domain-Specific Languages
Terence Parr (作者)
出版社: Pragmatic Bookshelf
附件
附有示例代码。代码可与我联系15367481@qq.com
相关推荐
标题和描述提到的“ANTLR实现计算器 ANTLR入门”意味着本文档将介绍如何利用ANTLR工具来实现一个简单的计算器。ANTLR(Another Tool for Language Recognition)是一个强大的语法分析器生成器,它能够帮助开发者创建...
这本书《ANTLR入门》由Terence Parr撰写,并由马维达翻译成中文,为读者提供了全面了解ANTLR的基础知识。 ANTLR的核心功能在于生成解析器和词法分析器,这两者是编译器设计和解析技术的关键组件。解析器负责理解...
在这个“antlr4入门例子”中,我们将会探讨如何使用ANTLR4创建一个简单的解析器来处理“hello world”这样的语句。"hello-antlr4"可能是项目或者示例代码的名称,它可能包含以下组件: 1. **ANTLR4 Grammar**:首先...
ANTLR 入门介绍小 demo ANTLR(ANother Tool for Language Recognition,另一个语言识别工具)是一种强大的解析器生成器,用于读取、处理、执行或翻译结构化的文本或二进制文件。ANTLR 广泛应用于 DSL(领域特定...
### ANTLR 入门与编译领域应用 #### 一、引言 ANTLR(ANother Tool for Language Recognition)是一款强大的语法解析工具,主要用于编译原理的学习和实践,特别是词法分析和语法分析方面。它是由Terence Parr教授...
ANTLR入门详细教程定稿.pdf
5. **执行流程** - 编写一个主程序(如`Main`类),创建Lexer和Parser对象,然后调用Parser的起始规则方法进行解析。 - 编译所有Java源代码,然后运行主程序。输入数据将被Lexer处理成Token,再由Parser解析并执行...
Antlr入门详解 中国知网论文:ANRLR安装、使用、文法详解
ANTLR之"Hello World",是ANTLR的入门。
"antlr4_getting-started.md at master · antlr_antlr4 · GitHub_files" 这个文件名看起来是一个链接到GitHub上的目录,通常包含与ANTLR 4入门教程相关的其他资源,如示例代码、图片或其他辅助文件。访问这个链接...
ANTLRWorks是ANTLR的一个集成开发环境,特别适合新手入门。你可以通过ANTLRWorks: 1. 创建语法文件:在ANTLRWorks中,你可以直观地定义语法规则,生成相应的词法和解析器代码。 2. 调试语法文件:ANTLRWorks提供了...
描述中提到的“ANTLR 编译器入门范例”表明这个资源是针对新手的教程材料,它包括了超过20个不同的示例,覆盖了大约200个文件。这些样本通常会涵盖ANTLR的基础用法,如定义语法规则、生成解析器、处理输入、构建抽象...
Antlr入门详细教程.doc 利用ANTLR生成C 描述的分析程序.htm 使用 Antlr 处理文本.htm 使用 Antlr 开发领域语言.htm 强悍的ANTLR Lexer.htm a little madness » Blog Archive » ANTLR By Example Part 1 The ...
5. **使用ANTLR**:使用ANTLR需要编写语法规则(Grammar)文件,这些文件定义了ANTLR应该识别的语言结构。ANTLR会根据这些规则生成解析器和词法分析器的Java代码,然后这些代码可以集成到用户的项目中,处理特定的...
ANTLR(ANother Tool for Language Recognition)是一个强大的解析器生成器,用于读取、处理、执行或翻译结构化文本或二进制文件。...如果你是初学者,这个入门实例会是一个很好的起点,帮助你掌握ANTLR的精髓。
这为不打算从源代码编译的开发者提供了一个快速入门的选项。 7. **runtime**: 可能是一个包含ANTLR C++运行时库的目录,包含了库文件和其他相关资源。 8. **demo**: 可能包含示例或演示项目,用于展示如何在...