`
weitao1026
  • 浏览: 1047616 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

kettle入门教程

 
阅读更多

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

百度经验:jingyan.baidu.com

方法/步骤

 
  1. 1

    Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)

    kettle的最新下载地址:community.pentaho.com/projects/data-integration/

  2. 2

    打开kettle

    首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip

    然后打开Spoon.bat,如图所示:

    打开后请耐心等待一会儿时间。

  3. 3

    建立转换。

    在文件->新建装换。

    新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:

    建立数据库连接的过程与其他数据库管理软件连接数据库类似。

    注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。

  4. 4

    简单的数据表插入\更新

    (1)新建表插入

    在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:

  5. 5

    双击拖过来的表,可以编辑表输入。

    选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。

  6. 6

    (2)通过插入\更新输出到表。

    在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:

  7. 7

    编辑插入更新:

    首先:表输入连接插入更新。

    选中表输入,按住shift键,拖向插入更新。

  8. 8

    然后:双击插入更新,编辑它。

    到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。

  9. 9

    使用作业控制上面装换执行。

    使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。

  10. 10

    双击start可以编辑,可以设置执行时间等等

  11. 11

    点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr

    最后点击运行即可。

     
分享到:
评论

相关推荐

    Kettle入门教程(详细介绍控件使用方法)

    本篇Kettle入门教程详细介绍了该工具的各个控件使用方法,旨在帮助所有用户轻松上手Kettle工具。 首先,Kettle资源库管理是使用Kettle的基础。Kettle允许用户创建、更新资源库,以及管理资源库中的用户登录和权限。...

    kettle入门教程:第一个kettle小例子.pdf

    【Kettle入门教程:第一个Kettle小例子】 Kettle,又称Pentaho Data Integration (PDI),是一款由Java编写的开源ETL(提取、转换、加载)工具,它支持跨平台运行,包括Windows、Linux和Unix系统。Kettle以其高效...

    kettle基础教程

    kettle 基础教程 本教程旨在介绍 kettle 的基本知识,包括安装、资源库创建等。 一、kettle 介绍 kettle 也称为 PDI(Pentaho Data Integration),是由 Matt 创建的一个开源的 BI 工具。kettle 的名称来源于它的...

    kettle初学者入门视频教程及文档

    【Kettle初学者入门视频教程及文档】是一个全面的学习资源,专为那些想要涉足或深化在数据处理领域中使用Kettle(Pentaho Data Integration,简称PDI)技能的初学者设计。Kettle是一个强大的ETL(提取、转换、加载)...

    ETL之kettle基础-PPT讲解

    学习Kettle需要一定的编程基础,特别是熟悉数据库操作,如MySQL和Oracle。在实践中,结合这些数据库知识,通过调试代码,可以更深入地理解和应用Kettle。通过学习Kettle,你可以掌握数据抽取、转换和装载的技巧,...

    kettle实战教程.pdf

    综上所述,Kettle实战教程提供了对Kettle工具深入的介绍和操作指导,内容覆盖了Kettle的基础知识、安装配置、实际操作和高级应用。通过本教程,用户可以有效提高使用Kettle进行数据处理和运维自动化的能力。

    kettle入门与实战视频教程(6-9)

    【Kettle入门与实战视频教程】是一套针对数据集成工具Pentaho Data Integration(简称Kettle)的基础到实践的指导课程,主要针对Kettle 4.3版本进行讲解。Kettle是一款强大的ETL(Extract, Transform, Load)工具,...

    史上最强-Kettle-培训教程.pdf

    【Kettle工具详解】 Kettle,又称Pentaho Data Integration(PDI),是一款强大的开源ETL(Extract, Transform, Load)工具,它采用Java编写,可在Windows、Linux、Unix等多种操作系统上运行。Kettle以其直观的图形...

    Kettle8.2入门PPT.rar

    **Kettle 8.2 入门教程** Kettle,也称为 Pentaho Data Integration (PDI),是一款强大的ETL(Extract, Transform, Load)工具,主要用于数据抽取、转换和加载。Kettle以其可视化的工作流设计、高效的数据处理能力...

    Kettle入门基础教程

    ### Kettle入门基础教程知识点概览 #### 一、Kettle资源库管理 **1.1 新建资源库** 在Kettle中,资源库管理是整个数据集成流程的基础。资源库用于集中存储Kettle的各种对象(如转换和作业),使得它们可以在多个...

    kettle入门与实战视频教程

    kettle入门与实战视频教程,基于kettle4.3版本进行讲解,第1-5节

    kettle入门与实战视频教程(10-13)

    【Kettle入门与实战视频教程】是一套针对数据集成工具Pentaho Data Integration(简称Kettle)的基础到实践的指导课程,特别适用于初学者。该教程以Kettle 4.3版本为教学基础,旨在帮助学习者快速掌握Kettle的各项...

    kettle_4.2.0基础教程

    ### Kettle 4.2.0 基础教程知识点详解 #### 1. Kettle 简介 Kettle,又称作Pentaho Data Integration(PDI),是一款开源的数据集成工具,由Matt Casters等人于2001年创建。自2006年起,Kettle成为Pentaho BI ...

    大数据技术-数据kettle-大数据基础kettle数据处理-学习(从入门到精通)

    ### 大数据技术-数据kettle-大数据基础kettle数据处理-学习(从入门到精通) #### 一、基础知识 **大数据技术**是指在海量、高速数据环境中进行数据管理和处理的技术体系。随着互联网的发展,数据量呈爆炸式增长,...

    kettle系列教程

    在Kettle教程中,通常会通过"Hello World"的简单例子来引导用户入门。这个示例通常会展示如何从一个数据源读取数据,进行简单的转换,然后将结果输出到另一个目标。 **2.4 重新设计Hello World示例** 此部分将介绍...

    KETTLE3.0帮助文档+4.2.1基础教程

    《KETTLE3.0帮助文档+4.2.1基础教程》是关于Pentaho Data Integration(Kettle)的综合学习资料,它涵盖了Kettle的早期版本3.0到较新版本4.2.1的基础知识。Kettle是一款强大的ETL(Extract, Transform, Load)工具,...

Global site tag (gtag.js) - Google Analytics