`

另外一个神奇的ETL工具,KETTLE

阅读更多
补充一下,我们之前调研过的一个ETL开源项目是  Kettle,这个应该没有CR-X那么强大,还支持流式数据(streaming)

KETTLE   
    Kettle是一款国外开源的etl工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。   这个ETL的开源项目的名称,很有意思,直译中文为“水壶”。按项目负责人Matt的说法:把各种数据发到一个壶里,然后呢,以一种你希望的格式流出。  
     Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
  Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。   作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。
分享到:
评论

相关推荐

    kettle同步数据库所有的表数据到其他库.rar

    Kettle,全称为Pentaho Data Integration(PDI),是一款强大的ETL(Extract, Transform, Load)工具,常用于数据整合、数据清洗和数据迁移等任务。本示例中的"Kettle同步数据库所有的表数据到其他库.rar"是一个具体...

    ETL-Kettle的说明文档Spoon_3_0_1_User_Guide.pdf

    Kettle是Pentaho公司推出的一款开源的ETL工具,它具有强大的数据转换和数据集成的能力。Spoon是Kettle的图形化界面工具,用于设计和执行ETL作业。 文档《Pentaho Data Integration Spoon 3.0 User Guide》提供了...

    kettle8 模拟表输入查询表名,然后在另一个表输入中使用变量使用

    Kettle8,也称为Pentaho Data Integration (PDI),是一款强大的ETL(提取、转换、加载)工具,能够帮助用户从各种数据源抽取数据,进行转换,并加载到目标系统中。在这个过程中,变量的使用是关键,它允许我们灵活地...

    ETL工具kettl实际中的一些应用说明

    Kettle是一款强大的开源ETL工具,以其灵活的配置和丰富的功能深受用户喜爱。本文将探讨Kettle在实际应用中的几个关键方面。 **一、资源库的设置** 资源库是Kettle中存储转换和作业的地方,它可以是数据库存储或...

    pentaho-kettle-8.3 ETL数据开发

    Pentaho Kettle 提供了全面的ETL工具集,包括数据抽取、转换和加载的各种操作。 2. **图形化工作流设计**:Kettle 使用 Spoon 设计工具,提供拖拽式的界面,用户可以通过直观的图形化工作流(Job)和转换...

    Kettle基础知识

    总的来说,Kettle作为一个强大的ETL工具,提供了丰富的图形化界面和命令行工具,支持灵活的数据处理和管理。无论是简单的数据迁移还是复杂的ETL流程,Kettle都能够提供全面的解决方案。通过理解和掌握Kettle的基础...

    (3)Kettle-----关联字典表的三种方法

    在数据处理和转换的过程中,关联字典表是一个常见的任务,特别是在使用Kettle(Pentaho Data Integration,简称PDI)这种强大的ETL工具时。Kettle提供了多种方式来完成这个任务,下面将详细介绍其中的三种方法。 1....

    kettle操作手册和基本用法

    Kettle Kettle家族的4个产品:Spoon、...Job和transformation的差别:transformation专注于数据的ETL,而Job的范围比较广,可以是Transformation,也可以是Mail、SQL、Shell、FTP等,甚至可以是另外一个Job。 .......

    使用Kettle同步mysql数据,增量同步教程执行步骤

    Kettle,也称为Pentaho Data Integration (PDI),是一款强大的ETL(提取、转换、加载)工具,能够高效地处理数据集成工作。 首先,我们需要理解什么是增量同步。增量同步是一种只同步自上次同步以来发生更改的数据...

    Kettle推送数据到Mysql数据库表时乱码.docx

    Kettle 是一个功能强大且流行的数据集成工具,广泛应用于数据抽取、转换和加载(ETL)过程中。然而,在使用 Kettle 将数据推送到 Mysql 数据库表时,可能会出现乱码问题。本文将详细介绍 Kettle 推送数据到 Mysql ...

    nux-dextop-release-0-2.el6.nux.noarch.rpm

    ETL工具Kettle研究-2-Kettle安装部署,Centos 6 需要下载另外的nux-dextop rpm安装包,否则执行yum install webkitgtk会出错。

    ETL中增量更新ETL中增量更新

    Kettle 是一个流行的 ETL 工具,提供了 Insert/Update 步骤、Delete 步骤和 Database Lookup 步骤来支持增量更新。增量更新的设计方法也是根据应用场景来选取的。 应用场景增量更新按照数据种类的不同大概可以分成...

    Kettle操作指南或Kettle应用详细说明书

    粤嵌gec6818开发板项目以下是关于ETL流程中Kettle使用的中文详细解说,旨在为大家提供一个实用的参考指南。这份资源详细介绍了Kettle在ETL(数据提取、转换、加载)过程中的使用方法,帮助用户更好地理解和应用这一...

    数据的导入导出工具 能迁移dmp\dbf\sqlserver\access等数据

    此外,SQL Server Integration Services (SSIS) 是一个强大的ETL(提取、转换、加载)工具,适用于复杂的数据迁移任务。 4. **Access数据迁移**:Access是一款轻量级的数据库管理系统,常用于小型企业或个人项目。...

    Kettle循环获取结果集中的数据并传入转换里面

    在数据处理领域,Kettle(Pentaho Data Integration,PDI)是一款强大的ETL(Extract, Transform, Load)工具,它允许用户从多种数据源提取数据,并进行转换和加载到目标系统。本话题主要探讨如何在Kettle中实现循环...

    dataCollection-0.0.6.zip

    总的来说,"dataCollection-0.0.6.zip"是一个基于Java和Spring Boot的数据集成项目,提供跨平台的启动脚本,支持多种数据库(如MySQL和Oracle)以及ETL工具(如Kettle)。项目采用YAML配置文件,易于管理和扩展,且...

    mysql与数据仓库的数据交互

    Kettle是一个图形化界面的ETL工具,功能强大,可以处理复杂的数据转换和数据抽取任务。DataX是阿里巴巴开源的一个数据同步工具,它具有Reader和Writer分离的架构,支持广泛的数据库和数据存储系统之间的数据迁移。 ...

    Instant Pentaho Data Integration Kitchen(2013)

    Pentaho Data Integration(Kettle)是企业级的数据集成工具,其中的Kitchen组件是其命令行接口,用于执行ETL(提取、转换、加载)过程。本资料主要围绕2013年版本的"Pentaho Data Integration Kitchen"进行解析,...

    warehouse

    在IT行业中,"warehouse"通常指的是数据仓库,它是一个用于存储和管理大量结构化数据的系统,以便进行分析和报告。在这个场景下,标签"PHP"提示我们可能是在讨论使用PHP技术来构建或操作数据仓库的相关内容。...

Global site tag (gtag.js) - Google Analytics