`
rmzdb
  • 浏览: 81661 次
  • 性别: Icon_minigender_1
  • 来自: 合肥
社区版块
存档分类
最新评论

【转】几种 ETL 工具的比较(Kettle,Talend,Informatica 等)

    博客分类:
  • ETL
 
阅读更多

成本:
软件成本包括多方面,主要包括软件产品, 售前培训, 售后咨询, 技术支持等。
开源产品本身是免费的,成本主要是培训和咨询,所以成本会一直维持在一个较低水平。
商业产品本身价格很高,但是一般会提供几次免费的咨询或支持,所以采用商用软件最初成本很高,但是逐渐下降。
手工编码最初成本不高,主要是人力成本,但后期维护的工作量会越来越大。

 

 

风险:
项目都是有风险的尤其是大项目。
项目的风险主要包括:超出预算,项目延期,没有达到用户的满意和期望
开源产品由于价格上的优势,可以在很大程度上降低项目的风险。

 

易用性:
Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供。
Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
Informatica:有非常容易使用的 GUI,但是要专门的训练。
Inaplex Inaport:没有GUI

 

技术支持:
Talend:主要在美国
Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员。
Informatica:遍布全世界
Inaplex Inaport:主要在英国

 

部署:
Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署。
Informatica:需要有 Server
Inaplex Inaport:需要 .net 2.0

 

速度:
Talend:需要手工调整,对特定数据源有优化知识。
Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计。
Informatica:是最快的
Inaplex Inaport:没有使用什么优化技术。

 

数据质量:
Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
Informatica:专门有一个产品 Informatica Data Quality 来保证数据质量
Inaplex Inaport:因为只处理特定数据,所以比较容易进行数据清洗。

 

监控:
Talend:有监控和日志工具
Kettle:有监控和日志工具
Informatica:有非常详细的监控和日志工具
Inaplex Inaport:有监控和日志工具

 

 

连接性:
Talend:各种常用数据库,文件,web service。
Kettle:非常广泛的数据库,文件,另外可以通过插件扩展。
Informatica:各种数据源
Inaplex Inaport:ODBC 连接

分享到:
评论

相关推荐

    5、ETL工具的比较(DataPipeline,Kettle,Talend,Informatica,Datax ,Oracle

    在众多的ETL工具中,DataPipeline、Kettle、Talend、Informatica、Datax 和 Oracle GoldenGate 是较为常见的几款。下面将对这些工具进行详细比较,以帮助你了解它们的特点和适用场景。 1. **DataPipeline** ...

    talend, kettle, informatica的比较

    标题与描述均聚焦于"talend, kettle, informatica的比较",这三大工具都是业界知名的ETL(Extract, Transform, Load)工具,用于数据仓库的构建与维护。ETL工具的主要功能是从不同的数据源抽取数据,进行清洗、转换...

    ETL工具对比分析

    本篇文章将对几种主流的ETL工具进行深入的对比分析,以帮助读者了解它们的特点、优势及适用场景。 1. **Informatica** Informatica是一款功能强大的ETL工具,以其用户友好的界面和丰富的数据处理能力而闻名。它...

    数据仓库ETL工具箱 中文版

    3. **ETL工具**:详细解析各种流行的ETL工具,如Informatica、Talend、IBM DataStage等,介绍它们的功能特性、使用场景和操作方法。此外,可能还会涉及开源ETL工具,如Kettle和Apache Nifi。 4. **数据抽取**:讲解...

    数据仓库ETL工具箱 Data Warehouse ETL Toolkit.rar

    - **商业工具**:如Informatica、 Talend、IBM DataStage等,它们提供了更高级的功能,如自动数据质量检查、复杂的数据映射和调度。 3. **数据仓库概念**: - **维度建模**:数据仓库通常基于维度模型设计,如...

    oracle,etl工程师--面试题锦集

    - **Informatica, Talend, SSIS**:其他常见的ETL工具,了解其基本概念和操作。 5. **性能监控与调优**: - **AWR报告**:Oracle自动工作区内存报告,用于分析数据库性能。 - **ASH报告**:活动会话历史报告,...

    KETTLE介绍

    Kettle,又称为Pentaho Data Integration (PDI),是一款强大的开源数据集成工具,主要用于数据的提取(Extract)、转换(Transform)和加载(Load)过程,也就是我们常说的ETL(Extract, Transform, Load)工作。...

    pentaho-kettle-6.1.0.2-R.zip

    相比于其他ETL工具(如Informatica、 Talend),Pentaho Kettle以其开源、易用和强大的功能受到欢迎。它在企业级应用中表现出色,特别是在大数据和云计算场景下。 通过深入了解Pentaho Kettle 6.1.0.2-R,我们可以...

    ETL概述及部分工具比较.rar

    在本资料"ETL概述及部分工具比较"中,我们将会深入探讨ETL的概念、重要性以及常用的ETL工具,并对OLAP专业工具和报表工具进行简要介绍。 ETL过程首先从数据提取(Extract)开始,这一阶段的目标是从各种来源,如...

    ETL

    加载过程中可能涉及的工具包括ETL软件(如Talend、Informatica)、数据库管理工具(如Oracle、MySQL)以及大数据平台(如Hadoop、Spark)。 在实际应用中,ETL与源码和工具紧密关联。源码通常指的是用于实现ETL过程...

    ETL增量原理

    在实际项目中,ETL工具如Kettle、Informatica、Talend等提供了内置的增量处理支持,可以通过配置轻松实现。同时,随着云服务的发展,如AWS Glue、Azure Data Factory等云原生的ETL服务也提供了增量加载的功能,简化...

    数据仓库与ETL的实现过程

    例如,Kettle、Talend、Informatica等商业ETL工具提供了图形化的工作流设计,简化了ETL流程的开发。而对于开源爱好者,Pentaho Data Integration(Kettle)、Apache Nifi、Spark等工具则提供了更多灵活性和定制能力...

    Kettle基本使用.docx

    ETL的实现方式多样化,包括手工编码、商业工具(如Informatica、IBM DataStage、Microsoft SSIS、Oracle ODI)以及开源工具(如Kettle、Talend、CloverETL)。 ### 2. Kettle特性与优势 - **图形化界面**:Kettle...

    ETL流程概述及常用实现方法 - CLoud的专栏 - CSDN博客1

    此外,ETL工具的选择也很重要,市面上有多种商业和开源的ETL工具,如Informatica、Talend、Kettle等,它们提供了图形化的界面和自动化的工作流,简化了ETL过程的实施和维护。 总的来说,ETL是数据集成的核心技术,...

    ETL中文帮助文档.rar

    4. **ETL工具**:文档可能涵盖了使用特定ETL工具的细节,如Talend、Informatica、SSIS(SQL Server Integration Services)或Kettle等。这可能包括创建工作流、设计ETL组件、调度任务和监控运行状态等操作。 5. **...

    ETL若干关键技术研究

    8. **ETL工具与框架**:市面上有许多ETL工具和框架,如Informatica、Talend、Kettle(Pentaho Data Integration)、Apache NiFi、Spark的DataFrames等。这些工具提供了图形化界面和脚本语言,简化了ETL流程的开发和...

    ETL项目:UNC CH BC ETL项目

    在"ETL-Project-main"中,转换规则和逻辑可能被定义在脚本或配置文件中,可能使用SQL、Python、Java或其他ETL工具如Informatica、Talend或SSIS实现。 3. **数据加载(Load)**:最后一步是将转换后的数据加载到目标...

    mysql数据导入到Oracle中

    2. **ETL工具**:使用 Extraction, Transformation, Loading (ETL) 工具,如 Talend, Informatica 或者 Oracle Data Integrator,这些工具能够自动化处理数据抽取、转换和加载的过程,适合大规模的数据迁移。...

Global site tag (gtag.js) - Google Analytics