决定采用Kettle作为ETL工具把第三方数据(SqlServer),经过简单粗暴的方式同步到本地我们这边的DW(Oracle),问题也基本解决,现在是想把其中碰到几个问题分享出来。
1.数据转换(最小单元任务)搭建
DB连接,如果是sqlserver、oracle因为考虑采用JDBC方式,kettle自身未携带jar包,所以需要把sqlserver4、ojdbc16放入lib目录下
2.数据在流程中,简单数据转换
这里我采用javascript的脚本,简单的语法
var yearvalue = LOG_TIME.getTime(); var value = yearvalue;
获取变量,那在接下来的就能获取value的变量值
3.当主任务需要分发给多个子任务时候
数据可能需要分发,则右键->数据发送->Round Robin,如果数据是重复性发送,选择复制发送模式
4.数据表的更新
a.直接通过插入、更新的机制
b.sql完成,执行SQL脚本
5.作业关联转换任务
其实作业是作为定时任务机制而采用,那么在完成作业时,有必要对于每个任务作为最小单元任务
6.作业对其时间控制
作业中start的按钮双击,进行时间控制
7.对于执行SQL的脚本,我们可以采纳preparestatment的预编译的方式来完成'?',sql的执行
8.如何使用脚本进行定时任务推动(环境变量先设置)
title WMS Data Migrate cd D:\Downloads\pdi-ce-5.0.1.A-stable\data-integration Kitchen.bat /file D:\NEVERSAYGOODBYE\KettleJob\job.kjb /level Basic /logfile d:\MyTest.log pause
9.linux则采用shell脚本即可启动,如果是job则采用kitchen,而转换则采用pan来执行
10.基础培训可以参考文件(baidu文库中下载)
相关推荐
以下将详细介绍两个Kettle数据转换类型的例子。 示例1:数据库间的数据提取和加载 在这个示例中,我们假设有一个数据源数据库(数据库A),我们需要从中提取数据,并将这些数据更新到另一个目标数据库(数据库B)。...
利用 Kettle 的 API 运用 Java 代码完成数据转换到 Excel 和数据库源码 Kettle 是一个开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定。Kettle 中有两种脚本文件,transformation 和 job,...
2. **Kettle数据转换**:在Kettle中,创建一个新的数据转换,这是Kettle工作的基本单元。添加"输入步骤",如"文本文件输入",来读取原始数据,然后添加"查找/替换"步骤来执行字典映射。 3. **配置查找/替换步骤**:...
在提供的文档《kettle数据转换工具.docx》和《Kettle使用说明.docx》中,应该详细介绍了这些步骤的具体配置和操作方法,包括如何在Kettle的界面中创建和编辑步骤,以及如何设置参数。这些文档是学习和应用Kettle进行...
本示例将深入探讨如何使用Kettle进行简单数据转换。 在Kettle中,数据转换是通过工作流(Job)和转换(Transformation)来实现的。工作流负责协调多个转换之间的执行顺序,而转换则专注于单个数据处理任务。在这个...
总的来说,Kettle执行转换每一行数据的过程涉及了数据库连接的配置、SQL查询的使用、数据转换步骤的创建以及结果数据的写入。通过Kettle,我们可以轻松地处理大量数据,实现复杂的ETL任务,而无需深入编写代码。
在本示例中,"kettle实现数据转换的完整例子"展示了如何利用Kettle进行数据处理操作。这个压缩包可能包含了Kettle的工作流文件(ktr)和相关的数据库脚本,以便于用户理解并学习Kettle的数据转换过程。 1. **Kettle...
四、Kettle数据转换 在数据转换阶段,Kettle提供了大量的预定义转换步骤,如“字段选择”用于筛选需要的列,“转换”用于修改数据类型或格式,“过滤”用于根据条件过滤数据,“聚合”用于计算统计信息等。同时,...
kettle数据抓取操作手册 kettle是一款功能强大的数据抓取和ETL...kettle数据抓取操作手册提供了详细的指导,帮助用户快速掌握kettle数据抓取操作的各个步骤,从连接数据库到执行转换,实现数据的自动抓取和转换。
5. **数据转换**:这是核心步骤,可以使用"转换步骤"进行数据计算、聚合、JOIN、派生字段等操作。例如,你可以使用"数学运算"步骤进行数值计算,"环形 JOIN"实现不同数据源的合并。 6. **数据输出**:转换完成后,...
在数据处理和分析中,kettle 是一个非常重要的工具,主要用于数据的过滤、转换和验证。在这篇文章中,我们将总结 kettle 的脚本,包括身份证 15 位转 18 位,以及各种数据的正则验证。 身份证 15 位转 18 位是 ...
转换的设计直观且灵活,可以处理各种复杂的数据转换任务。 3. **KJB文件**: KJB是Kettle作业文件的扩展名,它保存了作业的所有配置信息,包括各个步骤、作业间的连接以及控制流程的设置。这个.kjb文件可以在...
通过本文的介绍,我们了解了Kettle集群的基本概念、搭建步骤以及如何使用Kettle将MySQL数据转换为HBase数据的过程。Kettle作为一款强大的数据集成工具,在企业级数据处理中扮演着重要的角色,尤其是在大数据时代背景...
Java调用Kettle中的Job与转换是数据集成过程中的常见需求,Kettle(Pentaho Data Integration,简称PDI)是一种强大的ETL工具,而Java则作为通用编程语言,能够灵活地与各种系统进行交互。在Java中调用Kettle的Job和...
Kettle 数据抽取是数据集成和数据处理中非常重要的一步,它可以将数据从一个源系统中抽取出来,并将其转换成目标系统所需的格式,以便进行进一步的处理和分析。在本节中,我们将详细介绍 Kettle 数据抽取的全量抽取...
标题“Kettle数据导出为XML文件”涉及的是使用Pentaho Data Integration(通常称为Kettle或ETL工具)将数据转换并导出为XML格式的过程。Kettle是一款开源的数据集成工具,它允许用户通过图形化界面设计数据处理流程...
在这个压缩包中,每个文件可能代表一个特定的主题或者模块,例如:"Kettle数据转换设计"、"Kettle作业调度"、"Kettle性能优化"等。通过深入阅读和实践,你可以全面掌握Kettle的功能和技巧,无论你是数据工程师、数据...
2. **数据清洗**:在数据导入后,Kettle提供了一系列数据转换步骤,如“过滤行”、“替换字符串”、“删除重复行”等,用于清洗数据。如果需要使用JavaScript进行更复杂的数据处理,可以添加“JavaScript步骤”。在...
1. simple_mapping.zip:这个可能包含了一个基础的子转换示例,用于演示如何创建一个简单的数据转换流程,如从数据库中读取数据,进行简单的字段清洗或转换,然后写入另一个数据库或者文件系统。 2. extended_...