`
m635674608
  • 浏览: 5062482 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

kettle初探

 
阅读更多

   Kettle是Pentaho的一个组件,主要用于数据库间的数据迁移,到我用过的4.2版,还不支持noSQL,不知道4.4是不是支持了。

     Kettle自己有三个主要组件:Spoon,Kitchen,Pan。其中Spoon是一个图形化的界面,用于windows的时候,先设置环境变 量:pentaho_java_home,例如:C:\Program Files\Java\jdk1.7.0_25,其实就是你的java安装目录,1.6以上即可。windows下双击Spoon.bat就可以了,界面 如下:

      这里我建立了资源库,其实可以用文件形式存储,存储的结构都是xml,但是我还是觉得建立一个资源库比较好,以后看job等情况也比较简单,因为数据表的可读性比xml要好得多。建立资源库和文件资源库只需要把右上角的小加号点一下,就会出现如下如的界面:

      

      选择第一个就是建立数据库版的资源库,之后:

      

      之后:

      

      测试通过之后点击OK就回到最开始的界面,这时候选择test数据库连接,然后出入你的工程(我是这么叫的)ID和name,这里要记住,因为以后kitchen调度的时候要输入这个参数。

     

     在接下来弹出的框中都点“是”,然后会出现这个界面:

     

      这步会在你的用户下建立很多表,所以最好单独给资源库建立一个用户,当然这是在oracle下,mysql下和DB2下最好也采用同样的方式,把资源库和其他库分开。检查一下:

      

SQL> conn wings/wings@prism
已连接。
SQL> select count(1) from r_repository_log;

COUNT(1)
----------
0

SQL>

      表已经建好了。回到最开始的界面,选择test,点击确定,然后就会出现登录对话框,用户密码默认都是admin,以后可以自己改。

      接下来就可以开始用这个工具了。

      其实对于简单的数据库数据的抽取,基本只需要转换和作业这两种东西。下面就是建立一个转换的步骤:

      1 点击文件-->新建-->转换。

      2 在左侧的树状列表中选“主对象树”,新建DB连接。步骤和上面建资源库一样。一个目标库一个源库。

      3 在核心对象-->输入这个地方拖出一个表输入,在“输出”目录下拖出“表输出”,在“转换”处拖出一个字段选择来,如图:

      

       每一个对象都可以双击修改属性,下面以抽取world数据库的city表为例。

       双击表输入,选择数据库连接,选择源数据库,然后点击“获取SQL查询语句”,在弹出的对话框里进行选择即可,之后会变成这样:

      

      下面点击表输出:

       

       点击字段选择:

       

       这样,一个简单的抽取数据的转换就完成了。执行之,点击上面的绿色开始按钮。

       我也处在学习中,希望可以把我的经验分享给和我一样的入门者。

       下面是补充部分:

       在一个Job或者一个trans建立好之后,就可以建立定时任务了。如果是DS,那么DS客户端本身就支持schedule,但是Kettle因为没有服 务端和客户端的概念,因此只有使用linux的crontab,其实Job本身也支持定时,但是你必须保证图形界面一直开着,这样并不如crontab那 么好。在命令行里使用kettle很简单,Job用kitchen调度,trans用pan调度。

     下面是一个kitchen的调度命令:

     bash /home/kettle/data-integration/kitchen.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /job jobname

     rep那里写自己的资源库名称。

     trans和上面一样,略有不同:

     bash /home/kettle/data-integration/pan.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /trans transname

 

http://www.cnblogs.com/wingsless/p/3187436.html

分享到:
评论

相关推荐

    Kettle初探

    《Kettle初探:深入理解ETL工具的实践与应用》 **一、Kettle概述** Kettle,作为一款开源的ETL(Extract, Transform, Load)工具,以其高效的性能和广泛的兼容性著称。这款工具由纯Java编写,因此能够在多种操作...

    BI Kettle中文文档汇集

    Kettle初探.pdf Kettle命令行使用说明.pdf Kettle培训.ppt KETTLE基本知识培训.pptx kettle实现循环.pdf kettle常见问题FAQ.pdf kettle技术手册.pdf kettle接口抽取同步应用实例.pdf kettle文档.pdf ...

    Kettle学习资料分享,附大神用Kettle的一套流程完成对整个数据库迁移方法

    压缩包内的文件“kettle初探--内含配置信息.pdf”可能包含了Kettle的基本概念介绍,以及一些配置示例。对于初学者,这份资料将有助于理解Kettle的工作原理,如何配置数据源,设置转换和作业,以及如何调试和优化。...

    Kettle学习资料

    Kettle文档汇集,ELT平台操作手册-KETTLE,ETL工具Spoon 2.5.0用户手册,Kettle初探,KETTLE基本知识培训,Kettle命令行使用说明,Kettle的一些常见问题等文档

    Apache:Apache安全配置:Apache错误页面自定义与安全处理.pdf

    Apache:Apache安全配置:Apache错误页面自定义与安全处理.pdf

    基于stf改的web群控安卓系统.zip(毕设&课设&实训&大作业&竞赛&项目)

    项目工程资源经过严格测试运行并且功能上ok,可复现复刻,拿到资料包后可实现复刻出一样的项目,本人系统开发经验充足(全栈),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助 【资源内容】:包含源码、工程文件、说明等。资源质量优质,放心下载使用!可实现复现;设计报告可借鉴此项目;该资源内项目代码都经过测试运行,功能ok 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 【提供帮助】:有任何使用上的问题欢迎随时与我联系,及时抽时间努力解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 质量优质,放心下载使用。下载后请首先打开说明文件(如有);项目工程可实现复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,网络商品/电子资源资料具可复制性不支持退款,勿用于商业用途。质量优质,放心下载使用。

    【9477】基于springboot+vue的技术的农业设备租赁系统.zip

    技术选型 【后端】:Java 【框架】:springboot 【前端】:vue 【JDK版本】:JDK1.8 【数据库】:mysql 5.7+ 资源包含项目源码+数据库脚本+万字文档。 项目包含前后台完整源码,都经过本人调试,确保可以正常运行! 具体项目介绍可查看博主文章或私聊获取。 也可提供远程调试、二次开发、项目讲解服务,有意向可私聊。 助力学习实践,提升编程技能,快来获取这份宝贵的资源吧!

    ssm校园商铺系统.zip(毕设&课设&实训&大作业&竞赛&项目)

    项目工程资源经过严格测试运行并且功能上ok,可复现复刻,拿到资料包后可实现复刻出一样的项目,本人系统开发经验充足(全栈),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助 【资源内容】:包含源码、工程文件、说明等。资源质量优质,放心下载使用!可实现复现;设计报告可借鉴此项目;该资源内项目代码都经过测试运行,功能ok 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 【提供帮助】:有任何使用上的问题欢迎随时与我联系,及时抽时间努力解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 质量优质,放心下载使用。下载后请首先打开说明文件(如有);项目工程可实现复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,网络商品/电子资源资料具可复制性不支持退款,勿用于商业用途。质量优质,放心下载使用。

    OFDM系统降低PAPR算法(PTS、SLM与C变换技术)MATLAB仿真代码实现及性能评估,OFDM系统降低PAPR算法(PTS、SLM与C变换技术)完美运行MATLAB仿真代码,ofdm系统降低P

    OFDM系统降低PAPR算法(PTS、SLM与C变换技术)MATLAB仿真代码实现及性能评估,OFDM系统降低PAPR算法(PTS、SLM与C变换技术)完美运行MATLAB仿真代码,ofdm系统降低PAPR代码,可完美运行。 降低OFDM系统PAPR算法(PTS-SLM-C变)MATLAB仿真(有PTS、SLM、C变三种算法的CCDF仿真) 直接拿即可 仿真软件版本: matlab2012a ,ofdm系统; 降低PAPR代码; PTS算法; SLM算法; C变换算法; MATLAB仿真; CCDF仿真; matlab2012a,OFDM系统PAPR降低:PTS、SLM与C变换算法的MATLAB仿真研究

    线电压级联型多重化PWM变换器:一体化等效电路控制策略及性能分析,线电压级联型多重化PWM变换器:一体化等效电路控制策略与性能分析,线电压级联型多重化 PWM 变器是一种以传统 两电平六开关 PWM

    线电压级联型多重化PWM变换器:一体化等效电路控制策略及性能分析,线电压级联型多重化PWM变换器:一体化等效电路控制策略与性能分析,线电压级联型多重化 PWM 变器是一种以传统 两电平六开关 PWM 电压源型变器(Voltage Source Converter,简称 VSC)为组成单元的多重化变器,即线电压级联型功率变器(Line-voltage Cascaded VSC,简称 LVC-VSC)。 该种变器不仅继承了传统级联 H 桥型变器的优点,而且在构成三相电力系统时,所需隔离直流电源较少,且便于引入三相系统中的控制策略。 针对一种线电压级联型多重化功率变器为研究对象,以其作为网侧变器为例,提出一种基于一体化等效电路的控制方法。 仿真结果表明,所提出的控制策略不仅具有较好的动稳态性能,而且具有结构简单,易于设计实现等优点。 ,核心关键词: 线电压级联型多重化PWM变换器; 传统两电平六开关PWM电压源型变换器; LVC-VSC; 网侧变换器; 控刓方法; 仿真结果。,基于级联多重化PWM的线电压型VSC变换器及其控制策略研究

    图像识别,LaMa、Inpaint-Anything,大模型训练用的素材,sttn.pth

    图像识别,LaMa、Inpaint-Anything,大模型训练用的素材,sttn.pth。搞图像识别,一键去除图片中的人、物的都用这个

    C语言是一门经典的编程语言,入门到精通的步骤

    C语言是一门经典的编程语言,入门到精通的步骤。

    【9487】基于springboot+vue的城市垃圾分类管理系统--lw.zip

    技术选型 【后端】:Java 【框架】:springboot 【前端】:vue 【JDK版本】:JDK1.8 【数据库】:mysql 5.7+ 资源包含项目源码+数据库脚本+万字文档。 项目包含前后台完整源码,都经过本人调试,确保可以正常运行! 具体项目介绍可查看博主文章或私聊获取。 也可提供远程调试、二次开发、项目讲解服务,有意向可私聊。 助力学习实践,提升编程技能,快来获取这份宝贵的资源吧!

    基于QT交互与opencv制作的图片效果编辑器.zip(毕设&课设&实训&大作业&竞赛&项目)

    项目工程资源经过严格测试运行并且功能上ok,可复现复刻,拿到资料包后可实现复刻出一样的项目,本人系统开发经验充足(全栈),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助 【资源内容】:包含源码、工程文件、说明等。资源质量优质,放心下载使用!可实现复现;设计报告可借鉴此项目;该资源内项目代码都经过测试运行,功能ok 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 【提供帮助】:有任何使用上的问题欢迎随时与我联系,及时抽时间努力解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 质量优质,放心下载使用。下载后请首先打开说明文件(如有);项目工程可实现复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,网络商品/电子资源资料具可复制性不支持退款,勿用于商业用途。质量优质,放心下载使用。

    STM32电机速度控制与L298N驱动器的模糊PID算法:板载显示与Labview上位机监控,串口通信与按键控制,STM32电机速度控制与L298N驱动器的PID及模糊PID算法实现,板载屏与Labv

    STM32电机速度控制与L298N驱动器的模糊PID算法:板载显示与Labview上位机监控,串口通信与按键控制,STM32电机速度控制与L298N驱动器的PID及模糊PID算法实现,板载屏与Labview上位机显示转速,串口通信与数据收发功能,按键控制加减速及算法切换,STM32电机速度控制、L298N电机驱动、板载屏幕显示转速、上位机Labview显示电机转速、串口数据收发、控制算法PID、模糊PID。 按键加减速,按键切控制算法。 1.下位机单片机程序:(送Matlab的s函数PID模糊PID仿真模型) 2.上位机Labview软件 ,核心关键词: STM32电机速度控制; L298N电机驱动; 板载屏幕显示转速; 串口数据收发; 控制算法PID; 模糊PID; 下位机单片机程序; 上位机Labview软件; 按键加减速; 按键切换控制算法。,基于STM32的电机速度控制与算法切换系统

    IT运维管理中变更控制程序详解 - 规范企业IT变更流程确保系统稳定运营

    内容概要:本文档详细阐述了适用于公司的IT运维项目的变更管理控制程序,旨在保证变更在受控情况下评估、批准和实施。主要内容分为目的、适用范围、职责定义、工作程序和其他相关信息五大部分。工作程序详细描述三种类型的变更管理过程——标准变更、一般变更以及紧急变更,每种都经过变更请求、申请审批、实施及完成、回顾和归档四个主要阶段,还涉及变更管理和其他管理流程之间的关系和关键绩效指标。 适合人群:企业运维管理人员和技术团队、IT服务提供商及其他从事IT运维领域的工作人员。 使用场景及目标:帮助企业和IT机构建立系统的变更管理制度,规范各种变更流程,明确每个阶段的任务分配和职责权限,保障IT环境安全性、稳定性与可靠性的同时提高工作效率和服务质量。 其他说明:文中还介绍了配置管理员、运维经理在内的角色划分及其具体的工作职责,同时列出了如变更成功率这样的重要KPI来衡量变更效果,提供实际工作中所需的各种表格样例,如变更请求申请表等以供下载和模板参考。

    Apache:Apache模块:Apache模块的性能监控与分析.pdf

    Apache:Apache模块:Apache模块的性能监控与分析.pdf

    光热电站最优容量配置方法代码:以综合成本为目标,采用Cplex求解器的高效解决方案 (独家编写,灵活可改写),光热电站容量配置方法代码详解:以综合成本为目标,采用Cplex求解器的高效解决方案,光热电

    光热电站最优容量配置方法代码:以综合成本为目标,采用Cplex求解器的高效解决方案 (独家编写,灵活可改写),光热电站容量配置方法代码详解:以综合成本为目标,采用Cplex求解器的高效解决方案,光热电站容量配置方法代码 复现图中文献 以综合成本为目标采用cplex求解器求解 本人亲自编写,市面唯一,可改写性强 ,光热电站;容量配置方法;复现文献;Cplex求解器;综合成本;唯一编写。,基于Cplex求解器的光热电站综合成本优化配置代码研究

    IT运维领域的知识管理系统-ITSS标准知识库的建设与维护

    内容概要:该文档围绕构建和维护IT运维知识库的具体实施方案进行了详细描述。首先明确了该系统的目的在于对企业运维工作的知识、经验进行统一高效的管理,以优化效率并保障质量的同时降低成本;接着定义了这一制度适用的人群为公司内部以及外部涉及知识分享与交流的所有部门;还阐述了各个参与方所承担的责任,强调了运维部门作为主导,在资料搜集、存档及更新等环节的重要地位。文中着重讲述了工作流程方面的规则,涵盖从初始建设直至后续知识管理(积累、交流),再到具体流程管理(发布、更新、删除),最后列明所需关联的相关文件和支持材料记录。这为运维人员提供了标准化的操作指南,确保知识能够被高效地管理和运用。 适用人群:适用于公司内部与外部涉及到知识传递的各个群体,尤其是IT运营和维护团队。 使用场景及目标:旨在提供一整套关于企业级 ITSS 规范下知识资产的创建、传播与更新的方法论;帮助组织内的成员更加容易地访问既有经验和专业知识;减少由于信息不对称所带来的错误,促进业务的发展和技术的进步。 其他说明:本文为运维工作制定了标准化的知识管理体系,不仅提高了企业对内对外的服务水平,同时也加强了数据安全性和规范性。

    万能嗅探资源下载安装包

    万能嗅探资源下载安装包

Global site tag (gtag.js) - Google Analytics