`
cywhoyi
  • 浏览: 418604 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Kettle数据转换

阅读更多

决定采用Kettle作为ETL工具把第三方数据(SqlServer),经过简单粗暴的方式同步到本地我们这边的DW(Oracle),问题也基本解决,现在是想把其中碰到几个问题分享出来。

 

1.数据转换(最小单元任务)搭建

   DB连接,如果是sqlserver、oracle因为考虑采用JDBC方式,kettle自身未携带jar包,所以需要把sqlserver4、ojdbc16放入lib目录下

 

2.数据在流程中,简单数据转换

   这里我采用javascript的脚本,简单的语法

 

var yearvalue = LOG_TIME.getTime();
var value = yearvalue;

 

获取变量,那在接下来的就能获取value的变量值

 

 

3.当主任务需要分发给多个子任务时候

   数据可能需要分发,则右键->数据发送->Round Robin,如果数据是重复性发送,选择复制发送模式

 

4.数据表的更新

  a.直接通过插入、更新的机制

  b.sql完成,执行SQL脚本

 

5.作业关联转换任务

  其实作业是作为定时任务机制而采用,那么在完成作业时,有必要对于每个任务作为最小单元任务

 

6.作业对其时间控制

  作业中start的按钮双击,进行时间控制

 



 

 

 

 

 7.对于执行SQL的脚本,我们可以采纳preparestatment的预编译的方式来完成'?',sql的执行

 

 8.如何使用脚本进行定时任务推动(环境变量先设置)

title WMS Data Migrate
cd D:\Downloads\pdi-ce-5.0.1.A-stable\data-integration
Kitchen.bat /file D:\NEVERSAYGOODBYE\KettleJob\job.kjb /level Basic /logfile d:\MyTest.log
pause

 

9.linux则采用shell脚本即可启动,如果是job则采用kitchen,而转换则采用pan来执行



 

10.基础培训可以参考文件(baidu文库中下载)

 

  • 大小: 8.9 KB
  • 大小: 14.4 KB
  • 大小: 31.2 KB
  • 大小: 50.6 KB
  • 大小: 32.6 KB
1
0
分享到:
评论
2 楼 cywhoyi 2014-03-06  
liushicheng1 写道
请问楼主,那个定时的可视化的那个工具,要周期定时执行某个任务,该如何实现?是不是这个软件不能退出去,任务才会周期执行? 一般我们部署在Tomcat中是没问题的,但是现在就是一个普通java 应用程序,该怎么调度呢?

1.如果是java应用程序,你可以通过shell脚本调用,定时话可以通过linux cron的计划安排
2.可以通过quartz framework完成
3.ETL工具kettle本事也支持linux环境,我现在为了方便,这个工具不要退出去就能够保证周期性运行
1 楼 liushicheng1 2014-03-05  
请问楼主,那个定时的可视化的那个工具,要周期定时执行某个任务,该如何实现?是不是这个软件不能退出去,任务才会周期执行? 一般我们部署在Tomcat中是没问题的,但是现在就是一个普通java 应用程序,该怎么调度呢?

相关推荐

    KETTLE数据库转换类型例子

    以下将详细介绍两个Kettle数据转换类型的例子。 示例1:数据库间的数据提取和加载 在这个示例中,我们假设有一个数据源数据库(数据库A),我们需要从中提取数据,并将这些数据更新到另一个目标数据库(数据库B)。...

    利用kettle的api运用Java代码完成数据转换到excel和数据库源码

    利用 Kettle 的 API 运用 Java 代码完成数据转换到 Excel 和数据库源码 Kettle 是一个开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定。Kettle 中有两种脚本文件,transformation 和 job,...

    kettle实现字典转换实例

    2. **Kettle数据转换**:在Kettle中,创建一个新的数据转换,这是Kettle工作的基本单元。添加"输入步骤",如"文本文件输入",来读取原始数据,然后添加"查找/替换"步骤来执行字典映射。 3. **配置查找/替换步骤**:...

    使用kettle转换oracle与 mysql的表数据

    在提供的文档《kettle数据转换工具.docx》和《Kettle使用说明.docx》中,应该详细介绍了这些步骤的具体配置和操作方法,包括如何在Kettle的界面中创建和编辑步骤,以及如何设置参数。这些文档是学习和应用Kettle进行...

    kettle的简单数据转换demo

    本示例将深入探讨如何使用Kettle进行简单数据转换。 在Kettle中,数据转换是通过工作流(Job)和转换(Transformation)来实现的。工作流负责协调多个转换之间的执行顺序,而转换则专注于单个数据处理任务。在这个...

    kettle实现数据转换的完整例子

    在本示例中,"kettle实现数据转换的完整例子"展示了如何利用Kettle进行数据处理操作。这个压缩包可能包含了Kettle的工作流文件(ktr)和相关的数据库脚本,以便于用户理解并学习Kettle的数据转换过程。 1. **Kettle...

    ETL数据整合与处理(Kettle)教案.rar

    四、Kettle数据转换 在数据转换阶段,Kettle提供了大量的预定义转换步骤,如“字段选择”用于筛选需要的列,“转换”用于修改数据类型或格式,“过滤”用于根据条件过滤数据,“聚合”用于计算统计信息等。同时,...

    kettle执行转换每一行数据

    总的来说,Kettle执行转换每一行数据的过程涉及了数据库连接的配置、SQL查询的使用、数据转换步骤的创建以及结果数据的写入。通过Kettle,我们可以轻松地处理大量数据,实现复杂的ETL任务,而无需深入编写代码。

    kettle数据抓取操作手册

    kettle数据抓取操作手册 kettle是一款功能强大的数据抓取和ETL...kettle数据抓取操作手册提供了详细的指导,帮助用户快速掌握kettle数据抓取操作的各个步骤,从连接数据库到执行转换,实现数据的自动抓取和转换。

    kettle 数据过滤,验证

    在数据处理和分析中,kettle 是一个非常重要的工具,主要用于数据的过滤、转换和验证。在这篇文章中,我们将总结 kettle 的脚本,包括身份证 15 位转 18 位,以及各种数据的正则验证。 身份证 15 位转 18 位是 ...

    java调用kettle中的job与转换-源码

    Java调用Kettle中的Job与转换是数据集成过程中的常见需求,Kettle(Pentaho Data Integration,简称PDI)是一种强大的ETL工具,而Java则作为通用编程语言,能够灵活地与各种系统进行交互。在Java中调用Kettle的Job和...

    kettle集群搭建以及使用kettle将mysql数据转换为Hbase数据

    通过本文的介绍,我们了解了Kettle集群的基本概念、搭建步骤以及如何使用Kettle将MySQL数据转换为HBase数据的过程。Kettle作为一款强大的数据集成工具,在企业级数据处理中扮演着重要的角色,尤其是在大数据时代背景...

    《kettle子转换即映射》博客示例代码

    1. simple_mapping.zip:这个可能包含了一个基础的子转换示例,用于演示如何创建一个简单的数据转换流程,如从数据库中读取数据,进行简单的字段清洗或转换,然后写入另一个数据库或者文件系统。 2. extended_...

    (1)Kettle数据抽取---全量抽取

    Kettle 数据抽取是数据集成和数据处理中非常重要的一步,它可以将数据从一个源系统中抽取出来,并将其转换成目标系统所需的格式,以便进行进一步的处理和分析。在本节中,我们将详细介绍 Kettle 数据抽取的全量抽取...

    kettle转换数据的步骤,还算全面

    5. **数据转换**:这是核心步骤,可以使用"转换步骤"进行数据计算、聚合、JOIN、派生字段等操作。例如,你可以使用"数学运算"步骤进行数值计算,"环形 JOIN"实现不同数据源的合并。 6. **数据输出**:转换完成后,...

    kettle文档大集合

    在这个压缩包中,每个文件可能代表一个特定的主题或者模块,例如:"Kettle数据转换设计"、"Kettle作业调度"、"Kettle性能优化"等。通过深入阅读和实践,你可以全面掌握Kettle的功能和技巧,无论你是数据工程师、数据...

    kettle8.1转换-转换组件介绍文档

    ### Kettle 8.1 转换组件详细介绍 #### 1. 值映射组件(ValueMapper) - **功能概述**:值映射组件允许用户定义一系列映射规则,将流中的某个字段的值根据这些规则映射成新的字段值或替换原有字段的值。这种组件...

    《在kettle中实现数据验证和检查》示例代码

    在数据处理领域,Kettle(也称为Pentaho Data Integration,简称PDI)是一个强大的ETL(Extract, Transform, Load)工具,它提供了丰富的数据转换和加载功能。本示例代码着重于在Kettle中实现数据验证和检查,这对于...

    Java调用kettle转换

    在数据处理领域,Pentaho Data Integration(PDI),通常被称为Kettle,是一款非常强大的开源ETL工具,用于完成数据抽取、转换与加载(Extract, Transform, Load)任务。在实际业务场景中,我们常常需要通过编程的...

Global site tag (gtag.js) - Google Analytics