`
qingfeng_lxc
  • 浏览: 32188 次
  • 性别: Icon_minigender_2
  • 来自: 上海
社区版块
存档分类
最新评论

Kettle 和其它几种 ETL 工具(包括 Informatica)的比较

    博客分类:
  • ETL
 
阅读更多

compare

成本:
软件成本包括多方面,主要包括软件产品, 售前培训, 售后咨询, 技术支持等。
开源产品本身是免费的,成本主要是培训和咨询,所以成本会一直维持在一个较低水平。
商业产品本身价格很高,但是一般会提供几次免费的咨询或支持,所以采用商用软件最初成本很高,但是逐渐下降。
手工编码最初成本不高,主要是人力成本,但后期维护的工作量会越来越大。

compare_cost


风险:
项目都是有风险的尤其是大项目。
项目的风险主要包括:超出预算,项目延期,没有达到用户的满意和期望
开源产品由于价格上的优势,可以在很大程度上降低项目的风险。

易用性:
Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供。
Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
Informatica:有非常容易使用的 GUI,但是要专门的训练。
Inaplex Inaport:没有GUI

技术支持:
Talend:主要在美国
Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员。
Informatica:遍布全世界
Inaplex Inaport:主要在英国

部署:
Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署。
Informatica:需要有 Server
Inaplex Inaport:需要 .net 2.0

速度:
Talend:需要手工调整,对特定数据源有优化知识。
Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计。
Informatica:是最快的
Inaplex Inaport:没有使用什么优化技术。

数据质量:
Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。
Informatica:专门有一个产品 Informatica Data Quality 来保证数据质量
Inaplex Inaport:因为只处理特定数据,所以比较容易进行数据清洗。

监控:
Talend:有监控和日志工具
Kettle:有监控和日志工具
Informatica:有非常详细的监控和日志工具
Inaplex Inaport:有监控和日志工具

连接性:
Talend:各种常用数据库,文件,web service。
Kettle:非常广泛的数据库,文件,另外可以通过插件扩展。
Informatica:各种数据源
Inaplex Inaport:ODBC 连接

分享到:
评论

相关推荐

    5、ETL工具的比较(DataPipeline,Kettle,Talend,Informatica,Datax ,Oracle

    在众多的ETL工具中,DataPipeline、Kettle、Talend、Informatica、Datax 和 Oracle GoldenGate 是较为常见的几款。下面将对这些工具进行详细比较,以帮助你了解它们的特点和适用场景。 1. **DataPipeline** ...

    ETL工具信息整理

    - **数据源和目标配置**:Kettle 支持多种数据库连接,包括MySQL、Oracle、SQL Server等,同时也支持文件(CSV、Excel等)和其他格式的数据源。 - **转换步骤**:Kettle 提供了诸如输入步骤(如表输入、文本文件输入...

    数据同步ETL工具比较: TurboDX、Oracle GoldenGate、Kettle、DataX、Informatica的特性与应用场景分析

    内容概要:本文系统地对比了五款主流的数据同步/ETL工具——TurboDX、Oracle GoldenGate、Kettle、DataX以及Informatica。详细剖析各个工具的技术架构、适用范围、功能性以及实施复杂度等方面的优劣点,帮助企业在...

    ETL工具对比分析

    本篇文章将对几种主流的ETL工具进行深入的对比分析,以帮助读者了解它们的特点、优势及适用场景。 1. **Informatica** Informatica是一款功能强大的ETL工具,以其用户友好的界面和丰富的数据处理能力而闻名。它...

    ETL工具kettle学习总结

    ETL工具kettle学习总结 Kettle,也称为Pentaho Data Integration(PDI),是一款开源的ETL工具,项目开始于2003年,2006年加入了开源的BI组织Pentaho,正式命名为PDI。官方网站为http://kettle.pentaho.org/。 ...

    etl-kettle讲稿

    市场上常见的ETL工具有Informatica、Datastage、OWB和微软DTS等。 三、ETL技术的应用和挑战 ETL技术的应用不仅提高了数据处理的效率,还解决了数据集成中的问题,如不同系统间数据模型的不一致、业务过程的变化...

    oracle,etl工程师--面试题锦集

    - **Informatica, Talend, SSIS**:其他常见的ETL工具,了解其基本概念和操作。 5. **性能监控与调优**: - **AWR报告**:Oracle自动工作区内存报告,用于分析数据库性能。 - **ASH报告**:活动会话历史报告,...

    数据仓库ETL工具箱 Data Warehouse ETL Toolkit.rar

    综上所述,“数据仓库ETL工具箱 Data Warehouse ETL Toolkit.pdf”很可能包含有关如何选择和使用ETL工具、设计有效的ETL流程、解决常见问题以及最佳实践的详细信息。对于希望深入理解并应用ETL技术的人来说,这是一...

    数据仓库ETL工具箱 中文版

    3. **ETL工具**:详细解析各种流行的ETL工具,如Informatica、Talend、IBM DataStage等,介绍它们的功能特性、使用场景和操作方法。此外,可能还会涉及开源ETL工具,如Kettle和Apache Nifi。 4. **数据抽取**:讲解...

    绝对最全的etl资料

    5. **ETL工具比较**:`EAI-1050733-20090512-22_15_081585.pdf`可能包含了对不同ETL工具的评估和比较,对于选择适合的ETL解决方案非常有帮助。 这些文档和手册覆盖了从理论到实践的各个方面,对于想要深入了解ETL...

    最全的ETL资料

    6. **与其他ETL工具比较**:"informatica_pentaho_etl_tools_comparison.pdf"可能对比了Informatica和Pentaho Kettle在功能、性能、易用性等方面的差异,帮助用户选择适合的ETL工具。 7. **ETL实践**:"一个专用 ...

    ETL工具SSIS的功能介绍

    当前市场上存在多种ETL工具,如Informatica、Kettle、SSIS等。其中,**SQL Server Integration Services (SSIS)** 是Microsoft SQL Server 2008 R2的一个组件,广泛应用于企业级数据集成和工作流解决方案中。接下来...

    KETTLE介绍

    【KETTLE与其他ETL工具的对比】 与Talend和Informatica相比,Kettle在不同方面具有特点: - 成本:Kettle作为开源软件,主要成本在于培训和咨询,而Talend和Informatica则需要考虑软件许可费用。 - 风险:开源产品...

    pentaho-kettle-6.1.0.2-R.zip

    相比于其他ETL工具(如Informatica、 Talend),Pentaho Kettle以其开源、易用和强大的功能受到欢迎。它在企业级应用中表现出色,特别是在大数据和云计算场景下。 通过深入了解Pentaho Kettle 6.1.0.2-R,我们可以...

    开源大数据ETL工具的模块化组件构建技术研究.pdf

    例如,IBM的DataStage和Informatica是两款商业ETL软件,而Kettle作为一款开源ETL工具,提供了灵活的组件构建能力。 在Kettle中,ETL任务被分为两大类动作:转换(transformations)和作业(jobs)。转换用于处理...

    ETL概述及部分工具比较.rar

    在本资料"ETL概述及部分工具比较"中,我们将会深入探讨ETL的概念、重要性以及常用的ETL工具,并对OLAP专业工具和报表工具进行简要介绍。 ETL过程首先从数据提取(Extract)开始,这一阶段的目标是从各种来源,如...

    数据仓库ETL算法详解

    1. ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照...还有其他开源工具,如PDI(Kettle)等。

    ETL – ETL工具介绍

    开源工具如DataX和Kettle适合初学者和小规模项目,因为它们通常拥有丰富的学习资源和社区支持,而商业工具如DataStage和Informatica则更适合需要高级功能和专业服务的大型企业。 总的来说,ETL工具的选择是一个权衡...

Global site tag (gtag.js) - Google Analytics