`

另外一个神奇的ETL工具,KETTLE

阅读更多
补充一下,我们之前调研过的一个ETL开源项目是  Kettle,这个应该没有CR-X那么强大,还支持流式数据(streaming)

KETTLE   
    Kettle是一款国外开源的etl工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。   这个ETL的开源项目的名称,很有意思,直译中文为“水壶”。按项目负责人Matt的说法:把各种数据发到一个壶里,然后呢,以一种你希望的格式流出。  
     Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
  Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。   作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。
分享到:
评论

相关推荐

    kettle同步数据库所有的表数据到其他库.rar

    Kettle,全称为Pentaho Data Integration(PDI),是一款强大的ETL(Extract, Transform, Load)工具,常用于数据整合、数据清洗和数据迁移等任务。本示例中的"Kettle同步数据库所有的表数据到其他库.rar"是一个具体...

    kettle解析json串

    - Kettle(Pentaho Data Integration,简称PDI)是一款开源的数据集成工具,广泛用于ETL(Extract-Transform-Load)任务。 - Kettle支持多种数据源,包括关系型数据库、XML、CSV等格式的数据文件,以及复杂的JSON...

    ETL-Kettle的说明文档Spoon_3_0_1_User_Guide.pdf

    Kettle是Pentaho公司推出的一款开源的ETL工具,它具有强大的数据转换和数据集成的能力。Spoon是Kettle的图形化界面工具,用于设计和执行ETL作业。 文档《Pentaho Data Integration Spoon 3.0 User Guide》提供了...

    kettle8 模拟表输入查询表名,然后在另一个表输入中使用变量使用

    Kettle8,也称为Pentaho Data Integration (PDI),是一款强大的ETL(提取、转换、加载)工具,能够帮助用户从各种数据源抽取数据,进行转换,并加载到目标系统中。在这个过程中,变量的使用是关键,它允许我们灵活地...

    ETL工具kettl实际中的一些应用说明

    Kettle是一款强大的开源ETL工具,以其灵活的配置和丰富的功能深受用户喜爱。本文将探讨Kettle在实际应用中的几个关键方面。 **一、资源库的设置** 资源库是Kettle中存储转换和作业的地方,它可以是数据库存储或...

    pentaho-kettle-8.3 ETL数据开发

    Pentaho Kettle 提供了全面的ETL工具集,包括数据抽取、转换和加载的各种操作。 2. **图形化工作流设计**:Kettle 使用 Spoon 设计工具,提供拖拽式的界面,用户可以通过直观的图形化工作流(Job)和转换...

    Kettle基础知识

    总的来说,Kettle作为一个强大的ETL工具,提供了丰富的图形化界面和命令行工具,支持灵活的数据处理和管理。无论是简单的数据迁移还是复杂的ETL流程,Kettle都能够提供全面的解决方案。通过理解和掌握Kettle的基础...

    (3)Kettle-----关联字典表的三种方法

    在数据处理和转换的过程中,关联字典表是一个常见的任务,特别是在使用Kettle(Pentaho Data Integration,简称PDI)这种强大的ETL工具时。Kettle提供了多种方式来完成这个任务,下面将详细介绍其中的三种方法。 1....

    kettle操作手册和基本用法

    Kettle Kettle家族的4个产品:Spoon、...Job和transformation的差别:transformation专注于数据的ETL,而Job的范围比较广,可以是Transformation,也可以是Mail、SQL、Shell、FTP等,甚至可以是另外一个Job。 .......

    使用Kettle同步mysql数据,增量同步教程执行步骤

    Kettle,也称为Pentaho Data Integration (PDI),是一款强大的ETL(提取、转换、加载)工具,能够高效地处理数据集成工作。 首先,我们需要理解什么是增量同步。增量同步是一种只同步自上次同步以来发生更改的数据...

    java调用kettle文件

    Java与Kettle的集成使得开发者可以利用Java强大的编程能力来构建数据处理流程,扩展了Kettle的应用场景,使其不仅仅局限于独立运行的ETL工具。这对于需要在Java应用程序中嵌入复杂数据处理逻辑的场景尤其有用,例如...

    Kettle推送数据到Mysql数据库表时乱码.docx

    Kettle 是一个功能强大且流行的数据集成工具,广泛应用于数据抽取、转换和加载(ETL)过程中。然而,在使用 Kettle 将数据推送到 Mysql 数据库表时,可能会出现乱码问题。本文将详细介绍 Kettle 推送数据到 Mysql ...

    nux-dextop-release-0-2.el6.nux.noarch.rpm

    ETL工具Kettle研究-2-Kettle安装部署,Centos 6 需要下载另外的nux-dextop rpm安装包,否则执行yum install webkitgtk会出错。

    ETL中增量更新ETL中增量更新

    Kettle 是一个流行的 ETL 工具,提供了 Insert/Update 步骤、Delete 步骤和 Database Lookup 步骤来支持增量更新。增量更新的设计方法也是根据应用场景来选取的。 应用场景增量更新按照数据种类的不同大概可以分成...

    Kettle按日期变量批量执行任务配置图

    Kettle(又称Pentaho Data Integration或PDI)是一款开源的ETL工具,被广泛用于数据抽取、转换和加载(ETL)的工作。它提供了一套图形化的用户界面,使得用户可以通过拖放组件的方式来设计数据处理的流程。在数据...

    Kettle操作指南或Kettle应用详细说明书

    粤嵌gec6818开发板项目以下是关于ETL流程中Kettle使用的中文详细解说,旨在为大家提供一个实用的参考指南。这份资源详细介绍了Kettle在ETL(数据提取、转换、加载)过程中的使用方法,帮助用户更好地理解和应用这一...

    Kettle根据时间戳同步数据实现.pdf

    - Kettle是一种数据抽取、转换和加载(ETL)的工具,特别适合处理大规模数据集。 - 在大数据时代,实现数据实时同步的方案需要多方位考虑,包含但不限于对多种技术方案的尝试与评估。 - 为了应对Kettle在处理...

    供kettle使用JavaScript的bignumber包

    在数据处理和转换过程中,Kettle(也称为Pentaho Data Integration)是一个强大的工具,用于执行各种ETL(提取、转换、加载)操作。在处理大数据量的数字时,JavaScript内置的数值运算有时会出现精度问题,尤其是在...

    Kettle9.4版本 Pentaho Data Integration 9.4 PDI 9.4

    Pentaho Data Integration(PDI),常被称为Kettle,是pentaho商业智能套件中的一个关键组件,主要负责数据抽取、转换和加载(ETL)任务。Kettle9.4版本作为该系列软件的较新迭代,对数据处理与整合提供了诸多改进...

Global site tag (gtag.js) - Google Analytics