`
cywhoyi
  • 浏览: 420164 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Kettle数据转换

阅读更多

决定采用Kettle作为ETL工具把第三方数据(SqlServer),经过简单粗暴的方式同步到本地我们这边的DW(Oracle),问题也基本解决,现在是想把其中碰到几个问题分享出来。

 

1.数据转换(最小单元任务)搭建

   DB连接,如果是sqlserver、oracle因为考虑采用JDBC方式,kettle自身未携带jar包,所以需要把sqlserver4、ojdbc16放入lib目录下

 

2.数据在流程中,简单数据转换

   这里我采用javascript的脚本,简单的语法

 

var yearvalue = LOG_TIME.getTime();
var value = yearvalue;

 

获取变量,那在接下来的就能获取value的变量值

 

 

3.当主任务需要分发给多个子任务时候

   数据可能需要分发,则右键->数据发送->Round Robin,如果数据是重复性发送,选择复制发送模式

 

4.数据表的更新

  a.直接通过插入、更新的机制

  b.sql完成,执行SQL脚本

 

5.作业关联转换任务

  其实作业是作为定时任务机制而采用,那么在完成作业时,有必要对于每个任务作为最小单元任务

 

6.作业对其时间控制

  作业中start的按钮双击,进行时间控制

 



 

 

 

 

 7.对于执行SQL的脚本,我们可以采纳preparestatment的预编译的方式来完成'?',sql的执行

 

 8.如何使用脚本进行定时任务推动(环境变量先设置)

title WMS Data Migrate
cd D:\Downloads\pdi-ce-5.0.1.A-stable\data-integration
Kitchen.bat /file D:\NEVERSAYGOODBYE\KettleJob\job.kjb /level Basic /logfile d:\MyTest.log
pause

 

9.linux则采用shell脚本即可启动,如果是job则采用kitchen,而转换则采用pan来执行



 

10.基础培训可以参考文件(baidu文库中下载)

 

  • 大小: 8.9 KB
  • 大小: 14.4 KB
  • 大小: 31.2 KB
  • 大小: 50.6 KB
  • 大小: 32.6 KB
1
0
分享到:
评论
2 楼 cywhoyi 2014-03-06  
liushicheng1 写道
请问楼主,那个定时的可视化的那个工具,要周期定时执行某个任务,该如何实现?是不是这个软件不能退出去,任务才会周期执行? 一般我们部署在Tomcat中是没问题的,但是现在就是一个普通java 应用程序,该怎么调度呢?

1.如果是java应用程序,你可以通过shell脚本调用,定时话可以通过linux cron的计划安排
2.可以通过quartz framework完成
3.ETL工具kettle本事也支持linux环境,我现在为了方便,这个工具不要退出去就能够保证周期性运行
1 楼 liushicheng1 2014-03-05  
请问楼主,那个定时的可视化的那个工具,要周期定时执行某个任务,该如何实现?是不是这个软件不能退出去,任务才会周期执行? 一般我们部署在Tomcat中是没问题的,但是现在就是一个普通java 应用程序,该怎么调度呢?

相关推荐

    KETTLE数据库转换类型例子

    以下将详细介绍两个Kettle数据转换类型的例子。 示例1:数据库间的数据提取和加载 在这个示例中,我们假设有一个数据源数据库(数据库A),我们需要从中提取数据,并将这些数据更新到另一个目标数据库(数据库B)。...

    利用kettle的api运用Java代码完成数据转换到excel和数据库源码

    利用 Kettle 的 API 运用 Java 代码完成数据转换到 Excel 和数据库源码 Kettle 是一个开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定。Kettle 中有两种脚本文件,transformation 和 job,...

    kettle实现字典转换实例

    2. **Kettle数据转换**:在Kettle中,创建一个新的数据转换,这是Kettle工作的基本单元。添加"输入步骤",如"文本文件输入",来读取原始数据,然后添加"查找/替换"步骤来执行字典映射。 3. **配置查找/替换步骤**:...

    使用kettle转换oracle与 mysql的表数据

    在提供的文档《kettle数据转换工具.docx》和《Kettle使用说明.docx》中,应该详细介绍了这些步骤的具体配置和操作方法,包括如何在Kettle的界面中创建和编辑步骤,以及如何设置参数。这些文档是学习和应用Kettle进行...

    kettle的简单数据转换demo

    本示例将深入探讨如何使用Kettle进行简单数据转换。 在Kettle中,数据转换是通过工作流(Job)和转换(Transformation)来实现的。工作流负责协调多个转换之间的执行顺序,而转换则专注于单个数据处理任务。在这个...

    kettle实现数据转换的完整例子

    在本示例中,"kettle实现数据转换的完整例子"展示了如何利用Kettle进行数据处理操作。这个压缩包可能包含了Kettle的工作流文件(ktr)和相关的数据库脚本,以便于用户理解并学习Kettle的数据转换过程。 1. **Kettle...

    ETL数据整合与处理(Kettle)教案.rar

    四、Kettle数据转换 在数据转换阶段,Kettle提供了大量的预定义转换步骤,如“字段选择”用于筛选需要的列,“转换”用于修改数据类型或格式,“过滤”用于根据条件过滤数据,“聚合”用于计算统计信息等。同时,...

    kettle执行转换每一行数据

    总的来说,Kettle执行转换每一行数据的过程涉及了数据库连接的配置、SQL查询的使用、数据转换步骤的创建以及结果数据的写入。通过Kettle,我们可以轻松地处理大量数据,实现复杂的ETL任务,而无需深入编写代码。

    kettle数据抓取操作手册

    kettle数据抓取操作手册 kettle是一款功能强大的数据抓取和ETL...kettle数据抓取操作手册提供了详细的指导,帮助用户快速掌握kettle数据抓取操作的各个步骤,从连接数据库到执行转换,实现数据的自动抓取和转换。

    kettle转换数据的步骤,还算全面

    5. **数据转换**:这是核心步骤,可以使用"转换步骤"进行数据计算、聚合、JOIN、派生字段等操作。例如,你可以使用"数学运算"步骤进行数值计算,"环形 JOIN"实现不同数据源的合并。 6. **数据输出**:转换完成后,...

    kettle 数据过滤,验证

    在数据处理和分析中,kettle 是一个非常重要的工具,主要用于数据的过滤、转换和验证。在这篇文章中,我们将总结 kettle 的脚本,包括身份证 15 位转 18 位,以及各种数据的正则验证。 身份证 15 位转 18 位是 ...

    kettle作业及转换脚本.zip

    转换的设计直观且灵活,可以处理各种复杂的数据转换任务。 3. **KJB文件**: KJB是Kettle作业文件的扩展名,它保存了作业的所有配置信息,包括各个步骤、作业间的连接以及控制流程的设置。这个.kjb文件可以在...

    kettle集群搭建以及使用kettle将mysql数据转换为Hbase数据

    通过本文的介绍,我们了解了Kettle集群的基本概念、搭建步骤以及如何使用Kettle将MySQL数据转换为HBase数据的过程。Kettle作为一款强大的数据集成工具,在企业级数据处理中扮演着重要的角色,尤其是在大数据时代背景...

    java调用kettle中的job与转换-源码

    Java调用Kettle中的Job与转换是数据集成过程中的常见需求,Kettle(Pentaho Data Integration,简称PDI)是一种强大的ETL工具,而Java则作为通用编程语言,能够灵活地与各种系统进行交互。在Java中调用Kettle的Job和...

    (1)Kettle数据抽取---全量抽取

    Kettle 数据抽取是数据集成和数据处理中非常重要的一步,它可以将数据从一个源系统中抽取出来,并将其转换成目标系统所需的格式,以便进行进一步的处理和分析。在本节中,我们将详细介绍 Kettle 数据抽取的全量抽取...

    Kettle数据导出为XML文件

    标题“Kettle数据导出为XML文件”涉及的是使用Pentaho Data Integration(通常称为Kettle或ETL工具)将数据转换并导出为XML格式的过程。Kettle是一款开源的数据集成工具,它允许用户通过图形化界面设计数据处理流程...

    kettle文档大集合

    在这个压缩包中,每个文件可能代表一个特定的主题或者模块,例如:"Kettle数据转换设计"、"Kettle作业调度"、"Kettle性能优化"等。通过深入阅读和实践,你可以全面掌握Kettle的功能和技巧,无论你是数据工程师、数据...

    《kettle子转换即映射》博客示例代码

    1. simple_mapping.zip:这个可能包含了一个基础的子转换示例,用于演示如何创建一个简单的数据转换流程,如从数据库中读取数据,进行简单的字段清洗或转换,然后写入另一个数据库或者文件系统。 2. extended_...

    《在kettle中实现数据验证和检查》示例代码

    在数据处理领域,Kettle(也称为Pentaho Data Integration,简称PDI)是一个强大的ETL(Extract, Transform, Load)工具,它提供了丰富的数据转换和加载功能。本示例代码着重于在Kettle中实现数据验证和检查,这对于...

Global site tag (gtag.js) - Google Analytics