`
Salin
  • 浏览: 21439 次
  • 性别: Icon_minigender_1
  • 来自: 南京
文章分类
社区版块
存档分类
最新评论

(更新src)构建编译器,设计自己的脚本语言

阅读更多
相关贴
http://www.iteye.com/topic/405561

前几天做动态表单的时候老总给了我一个好东东:Antlr
为什么说Antlr是好东东呢?因为他很有意思
今天琢磨了1天,搞了个简单的小东西

目标:设计自己的脚本语言

先说说为啥要设计自己的脚本语言。
举一个例子:

在数据仓库领域,我们在做ETL的时候往往会从A地方取的一堆数据,加工后塞到B地方。
我们可以用java写个程序让后编译运行,让它来做这个事。
或者,我们更希望能简单点,比方说写个脚本
$source:url="jdbc:hsqldb:mem:Test",table="DB1"
$target:url="jdbc:hsqldb:mem:Test2",table="DB2"

#copy{
   $target.First_Name=$source.First_Name  
   $target.Last_Name=$source.Last_Name 
   $target.Address=$source.Address 
}

这个脚本一看就能懂吧,从一个库把数据拷到另一个库,是不是很简单 ?:D

不过问题来了,脚本写出来了,但是我们怎么运行它呢?JavaCompiler貌似不认识这个东西。 
好吧,那我们自己来做一个编译器和运行器。

不要惊讶,这并不是一个很复杂困难的工作

第一步:构建脚本编译器

理论上来说,这一步实际上是很复杂的,牵涉到递归下降,词法分析,语法分析等等好多事情,不过好在有Antlr这个东西作为我们实现编译器的基础,让我们这些不是很精通编译原理的人也能做出编译器来。
Antlr的资料网上还是很多的。

第二步:构建脚本的运行环境

脚本的运行是需要有一个上下文环境的,比方说
$source:url="jdbc:hsqldb:mem:Test",table="DB1"

<script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>在这里,脚本中声明了一个数据源source,当我们编译脚本的时候,也需要在上下文对象(Context)中配置一个数据源对象。
看到这里,一定感觉Context的意义很抽象,先别急。

第三部:脚本的运行方式

在Antlr的帮助下,我们可以做到对于脚本的直接解释运行的,不过这里我想用另外的一种方式
将脚本转义成Java代码,然后把Java代码拷贝到一个实现准备好的模板Java类的某个方法里,然后动态编译加载这个Java类,并运行该方法

编译前的脚本
#copy{
   $target.First_Name=$source.First_Name  
   $target.Last_Name=$source.Last_Name 
   $target.Address=$source.Address 
}

这段脚本编译后变成了
String sql1 = "SELECT First_Name,Last_Name,Address FROM DB1";
String sql2 = "INSERT INTO DB2 (First_Name,Last_Name,Address) VALUES (";
ResultSet rs = sourceStm.executeQuery(sql1);
while (rs.next()) {
	targetStm.execute(sql2 + "'" + rs.getString("First_Name") + "'"
		+ "," + "'" + rs.getString("Last_Name") + "'" + "," + "'"
		+ rs.getString("Address") + "'" + ")");
}

只是写个例子,所以这段sql比较笨,不过这不是重点。
之后,把上面这段代码拷贝到下面

public class RuntimeTemplate {

	public void execute() throws Exception {

		System.out.println("开始执行");

		/* start */

		/* end */

		System.out.println("执行完毕");
	}

}

就像这样,把转义好的代码拷贝到/* start */和/* end */之间。

之所以这样画蛇添足,是出于两点考虑:
1.性能问题。
2.由于这些代码是被拷贝到Java类中的,所以对于很多脚本本身不能满足的功能,可以直接在脚本中写Java代码,编译时候直接复制过去,这样很方便:D

动态编译也很简单,两行代码的事
JavaCompilerTool compiler = ToolProvider.getSystemJavaCompilerTool();
compiler.run(null, null, null, "etl/Runtime.java");


然后重写一下ClassLoader,加载编译后的class文件,最后运行
Object obj = clz.newInstance();
clz.getMethod("init", new Class[] { Context.class }).invoke(obj, ctx);
clz.getMethod("execute", new Class[] {}).invoke(obj);

在这里,把之前准备好的Context对象传给了脚本运行对象。

OK,这样就搞定了基本的工作流程。

########################################################################

目前已经有了一定的进展,可以解释如下的脚本

$source : url = "jdbc:hsqldb:mem:Test", table = "DB1"
$target : url = "jdbc:hsqldb:mem:Test", table = "DB2"

$target.FIRST_NAME = $source.FIRST_NAME + "ABC"
$target.LAST_NAME = $source.LAST_NAME + 123.456
$target.FULL_NAME = $source.FIRST_NAME + $source.LAST_NAME
$target.ADDRESS = $source.ADDRESS

if( "ss"+"aa"=="ssaa" or (1+1!=2 and 1+1>=2) ){
   if( $source.FIRST_NAME  == "name1" ){
      #copy
   }
}

附件是SRC
LIB比较大,自行下载Antlr3.1.2
http://www.antlr.org/download.html
测试用的DB是h2sql

需求:JDK1.6(1.6可以直接调用CompilerTool,不用调外部exe了,本人比较懒 )
注意是JDK1.6,JRE不行,而且有的JDK中的类名是JavaCompilerTool,有的是JavaCompile,根据自身情况改下。

还差一个数据库字段类型转换没做,现在所有数据库字段类型都当做String来处理




  • src.rar (15.9 KB)
  • 下载次数: 117
分享到:
评论
4 楼 云中苍月 2009-06-09  
简单扼要的文章呀,赞一个。
虽说老大要求用这个东西,不过个人感觉还是Groovy之类的脚本语言更适合。LZ有空和我一起研究研究吧。
3 楼 lc4ever 2009-06-08  
Hibernate的hql是用这个东西做的语法分析,有兴趣深入了解,可以参考一下Hibernate的源代码.
2 楼 kjj 2009-06-08  
不错,希望楼主说明一下这个东西,你再动态表单上的用法,我也想学习学习!!!
1 楼 Salin 2009-06-08  
http://www.antlr.org/
Antlr的项目主页,有兴趣可以看看

相关推荐

    delphi实的词法分析与编译器实现,yacc&lex

    压缩包中的文件可能包括项目的历史记录(ChangeLog)、许可信息(LICENSE)、构建脚本(Makefile)、说明文档(README)、与Debian包管理相关的文件(debian)、测试用例(test)、源代码(src)以及文档资料(doc)...

    C--语言编译器,词法分析器|语法分析器|中间代码(四元式)生成.zip

    标题 "C--语言编译器,词法分析器|语法分析器|中间代码(四元式)生成" 提供了关于构建一个C--语言编译器的信息,涉及到编译器设计与实现的关键步骤:词法分析、语法分析以及中间代码(四元式)的生成。这些是编译...

    脚本引擎内核源代码之:类C/C++脚本引擎_AngelScript_2.17.2

    《深入解析AngelScript 2.17.2:构建高效脚本引擎内核》 AngelScript是一款开源的、类C/C++的脚本引擎,它允许开发者在应用程序中嵌入自定义的脚本语言,从而实现灵活的逻辑控制和动态行为。版本2.17.2是其一个重要...

    SNL编译器Web版源码

    【SNL编译器Web版源码】是一个用于在线编译和执行SNL语言的项目,它基于Java Servlet技术和Tomcat应用服务器构建。这个项目的主要目的是提供一个方便、高效的平台,使得用户可以在Web环境下编写、运行和调试SNL代码...

    rustc-1.61.0-src.tar.gz

    Rust构建系统具有一个名为x.py的Python脚本,用于引导构建编译器。 可以通过运行./x.py --help o找到有关它的更多信息。 使每个人都可以构建可靠,高效的软件。 Rust编程语言这是Rust的主要源代码存储库。 它包含...

    利用ant脚本 自动构建svn增量.docx

    - **目录结构**:构建脚本通常包含源代码目录(src)、目标目录(dest)、输出目录(dist)等,用于存放不同阶段的文件。 - **脚本内容**:定义目标(target)和任务(task),如`checkout`用于检出代码,`increment...

    VB for Android 核心代码(编译器)

    【VB for Android 核心代码(编译器)】是一个专为Android平台设计的Visual Basic (VB)编程语言实现,其核心代码用Java语言编写,依赖于Google的Simple框架。这个项目旨在为开发者提供一种使用VB语法进行Android应用...

    Lua:使用CMake构建系统的Lua脚本语言。 Lua源代码未修改,仅添加了CMake文件-lua source code

    Lua是一种轻量级的、可嵌入式的脚本语言,以其简洁、高效的语法设计和强大的功能在游戏开发、服务器管理、脚本自动化等多个领域得到广泛应用。CMake则是一种跨平台的构建工具,能够生成各种编译器的项目文件,简化了...

    cc.bat Go安装交叉编译器

    放置`cc.bat`的位置是`C:\go\src`,这表明它被设计为与Go语言的源代码目录相结合。Go的默认安装路径通常为`C:\Go`,而`src`子目录通常用于存放用户的Go项目源代码。因此,将`cc.bat`放在这里是为了方便用户直接在Go...

    基于Java的实例开发源码-SnakeScript Java游戏脚本引擎 v1.1.zip

    在这个实例中,Java不仅作为基础开发语言,还被用来构建了一个游戏脚本引擎,使得游戏逻辑可以以脚本形式编写,提高了代码的可读性和可维护性。同时,由于是软件/插件的形式,开发者可以将SnakeScript引擎集成到自己...

    otp_src_25.0.3.tar.gz

    OTP(Open Telecommunications Platform)是Erlang编程语言的核心组件之一,它提供了一整套用于构建高度可...同时,Erlang/OTP的设计理念和实践经验也可以启发其他语言和平台的开发者,推动他们改进自己的软件设计。

    Keil5配置GCC编译器编译STM32工程示例

    - 预构建命令可以用于生成启动文件(如`startup_stm32f10x.s`)和链接脚本(如`stm32f10x_flash.ld`),这些通常在Keil工程中由内部工具自动生成。 - 后构建命令用于执行`arm-none-eabi-gcc`进行编译和链接,例如...

    tcl8.4.19-src.tar.gz

    tcl8.4.19-src.tar.gz是一款经典的开源脚本语言Tcl的源代码包,它为开发者提供了深入理解Tcl语言及其内部机制的机会。Tcl(Tool Command Language)是由John Ousterhout教授在1988年开发的一种轻量级、动态类型的...

    java语言的词法分析器(手动与flex)。使用cmake、c语言构建。.zip

    Java语言的词法分析器是编译器设计过程中的关键组件,它负责将源代码文本转换成一个个有意义的符号或标记,为语法分析提供输入。本项目提供了两种方法实现Java语言的词法分析器:手动编写和使用Flex工具。Flex是一种...

    Cmake编译器

    CMake使用一种简单的脚本语言,称为CMake语法规则,用于描述项目结构和构建步骤。这些规则通常存储在名为`CMakeLists.txt`的文件中。开发者通过这些规则告诉CMake如何处理源代码、链接库、配置选项等。CMake的核心...

    build-common:cc ++项目中使用的常见构建脚本

    在给定的标题和描述中,我们可以推测这个项目可能包含了一系列用于C/C++项目的构建工具和脚本,可能采用了`Python`作为实现语言。 `CMake`是一个广泛使用的跨平台的开源构建系统,它能够生成各种编译器所需的构建...

    visual c++ HGE游戏引擎+Lua脚本的结合使用.zip

    2. 数据驱动:通过Lua脚本,可以实现数据配置文件,如物品属性、地图信息等,使得游戏内容的更新更加灵活。 3. 用户界面:Lua也可以用来创建简单的用户界面,比如菜单、提示信息等,让开发者能快速迭代UI设计。 五...

    qtscript-everywhere-src-5.15.0.zip

    在Qt的生态系统中,Qt Script扮演了重要的角色,它提供了一种动态、灵活的方式来编写应用程序的逻辑,使得非程序员也能通过脚本语言来操控Qt应用。本文将深入探讨"qtscript-everywhere-src-5.15.0.zip"这个压缩包中...

    tcl8.5.11-src.tar.gz,tk8.5.11-src.tar.gz,tcl8.6.8-src.tar.gz,tk8.6.8-src.tar.gz

    这些文件是关于TCL(Tool Command Language)和TK(Tk Toolkit)的源代码包,用于构建和开发这两种语言的最新版本。TCL是一种脚本语言,而TK是与之配套的图形用户界面(GUI)工具包,它们常被用于创建跨平台的应用...

Global site tag (gtag.js) - Google Analytics