开始前的准备工作
1. 下载并安装JDK1.5以上(包含1.5)版本。因为kettle3.0开始将会全面转向JDK1.5。
2. 准备一个IDE开发工具。首选开源的Eclipse。
3. 下载Kettle2.5.1源码。http://sourceforge.net/project/showfiles.php?group_id=140317&package_id=186321
4. 利用下载的源码创建eclipse工程。
5. 使用源码里自带的ant(distrib)任务编译并生成kettle可执行程序。
6. 在distrib目录下,找到spoon.bat并执行,看看是否正常。
制作步骤:
1. 在eclipse里面, 复制be.ibridge.kettle.trans.step.dummytrans包到 be.ibridge.kettle.trans.step.mytrans。
在dummytrans包里面,一共有5个文件。DummyTrans.java, DummyTransData.java, DummyTransDialog.java, DummyTransMeta.java, Messages.java。
2. 然后, 使用eclipse里面Refactor(重构)的功能,把 DummyTrans* .java改名成 Mytrans *.java。(这一步靠手工修改也可以完成,但要花很多时间和精力)
3. 修改 MytransDialog.java ,Mytrans.java, MytransMeta.java, MytransData.java
其中:
MytransDialog.java是产生对话框的对象,需要把原来DummyTransDialog.java相关的标签修改掉,例如:Messages.getString("DummyTransDialog.Stepname.Label")。
Mytrans.java主要负责数据处理和转换,主要的转换逻辑都在这里实现。
MytransMeta.java主要负责元数据处理。包括加载xml转换文件,校验。
MytransData.java主要包含数据处理所涉及到的具体数据。
4. 在be.ibridge.kettle.trans.step.mytrans包下面创建messages目录,在里面添加相关的资源文件。例如,messages_en_US.properties,messages_zh_CN.properties等等。
5. 为我们的Step制作一个图标,并在BaseStep 里面添加相关的static finals信息。 例如,new StepPluginMeta(ExcelOutputMeta.class, "ExcelOutput", Messages.getString("BaseStep.TypeLongDesc.ExcelOutput"), Messages.getString("BaseStep.TypeTooltipDesc.ExcelOutput"), "XLO.png", CATEGORY_OUTPUT)
6. 执行ant编译任务distrib,编译并打包。
7. 在distrib目录下,找到spoon.bat并执行。进入spoon后,展开左边的“Core Object”树看看,有没有出现我们制作的新Step的图标。
相关推荐
标题 "Kettle ETL Step 插件制作 --(1)" 涉及到的是一个关于数据集成工具Pentaho Kettle(也称为Kettle或Spoon)的扩展开发过程,特别是如何创建自定义的数据抽取、转换和加载(ETL)步骤。在Kettle中,ETL步骤是...
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
10.KETTLE之自定义Step、Job插件制作1 11.KETTLE之自定义Step、Job插件制作2 12.KETTLE之自定义Step、Job插件制作3 13.KETTLE之数据同步方案 14.KETTLE之分区、集群以及原理 15.KETTLE之源码分析与二次开发
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
【课程大纲】01.etl使用简介_...共3页.pptx10.KETTLE之自定义Step、Job插件制作 共10页.pptx13.KETTLE之数据同步方案 共9页.pptx14.KETTLE之分区、集群以及原理 共20页.pptx15.KETTLE之源码分析与二次开发 共14页.pptx
8. **数据仓库与ETL**:Kettle在数据仓库建设中扮演重要角色,它能够抽取来自不同系统的数据,进行清洗、转换,并加载到数据仓库中,为数据分析和报表制作提供基础。 9. **版本控制**:Kettle支持版本控制,如...