一、什么是BI
首先,在网上搜了一下,BI的范围有点大,下面就自己整理一下:
1.商业智能不是一种新技术,而是技术的组合达到一种目的,提供一种解决方案,以帮助企业决策为目的技术及其应用。
2.构成:数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成。
3.涉及的领域:数据仓库、联机分析处理(OLAP)工具和数据挖掘等。
OLAP工具。提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。OLAP也被称为多维分析。
数据挖掘(Data Mining)软件。使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。
数据仓库(Data Warehouse)和数据集市(Data Mart)产品。包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型。
联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。
4.整体过程:商业智能从基础的数据出发,最终达到能被使用的知识以供决策,故:
数据(Data)----->信息(Information)----->知识(Knowledge)
所以,数据仍然是整个商业智能的基础。下面说说和数据打交道的ETL。
二、ETL
ETL的定义 ETL分别是“Extract”、“ Transform” 、“Load”三个单词的首字母缩写也就是“抽取”、“转换”、“装载”:
将数据从各种原始的业务系统中读取出来,然后按照预先设计好的规则将抽取得数据进行转换,使本来异构的数据格式能统一起来,最后将转换完的数据按计划增量或全部导入到数据仓库中。
显然,在当前,ETL工具要对平台的支持、对数据源的支持、数据转换功能、管理和调度功能、集成和开放性、对元数据的管理。尤其是在云计算背景下对云存储的支持,这也是以后的论文方向。
下面列举一下网上的ETL工具吧。这些是直接从网上搜到的,地址没有一一验证。
kettle http://kettle.pentaho.org/ ,pentaho官方的ETL工具,是一个metadata-driven 的ETL工具,不需要自己写code .
talend http://www.talend.com/ talend是talend自己公司的产品,宣传的是全功能的Data Integration 解决方案,基于eclipse 平台,包括很多的模块来实现商业流程建模,数据流程建模,最后输出的是perl 和 Java code
jasperETL http://www.jaspersoft.com/ JasperETL是基于talend的平台,不太清楚有什么区别,jaspersoft开发的ETL产品.
Octopus http://www.enhydra.org/tech/octopus/index.html octopuc是enhydra 的一个ETL工具,enhydra是一个产品跨度非常大的开源站点,它有个开源的Workflow ,Shark ,pentaho就是使用的这个Workflow ,这个组织从workflow 到application server , 从ETL工具到application framework ,还有一些其他的中间件,octopus非常的原始,支持任何的JDBC数据源,用XML语言来定义的.也支持JDBC-DOBC ,和excel 和 access ,csv-files, XML files ,用Ant 和 JUnit 来创建表和测试.
CloverETL http://cloveretl.berlios.de/ CloverETL是提供给你一组API,用XML来定义ETL过程,同样支持JDBC数据源, CloverETL是开源的,但是它是没有图形界面的,它提供一个有图形界面的CloverGUI 来进行ETL的图形化开发过程,但是不是开源的,需要购买商业许可证.
KETL http://www.ketl.org/ 听说是几个前IBM员工做出来的ETL产品,
另外还有很多.不一一写介绍了,只列个表吧,
Joost http://joost.sourceforge.net/ 最近有个web2.0 网站也叫Joost,名字相同而已.
Xineo http://software.xineo.net/xil.jspx
BabelDoc http://sourceforge.net/projects/babeldoc
CB2XML http://sourceforge.net/projects/cb2xml
mec-eagle http://sourceforge.net/projects/mec-eagle/
Transmorpher http://transmorpher.inrialpes.fr/
XPipe http://xpipe.sourceforge.net/Articles/Miscellaneous/fog0000000018.html
DataSift http://www.datasift.org/
Xephyrus Flume http://www.xephyrus.com/flume/flume-intro.Prlx
Smallx https://smallx.dev.java.net/
Nux http://dsd.lbl.gov/nux/index.html
Netflux http://www.netflux.org/
OpenDigger https://opendigger.dev.java.net/
ServingXML http://servingxml.sourceforge.net/
Scriptella http://scriptella.javaforge.com/
ETL Integrator http://www.glassfishwiki.org/jbiwiki/Wiki.jsp?page=ETLSE
Jitterbit http://www.jitterbit.com/
Apatar http://www.apatar.com/
Spring Batch http://static.springframework.org/spring-batch/
当然还有一些企业级的商用软件如:
Informatica Powercenter
Datastage
分享到:
相关推荐
选择ETL工具时,需要考虑的关键因素包括:支持的数据源多样性、元数据管理能力、对不同数据源的兼容性、与其他工具集成的能力、数据转换的复杂性、运行平台的稳定性、部署集成的难易程度、对数据质量的控制、所需的...
ETL工具比较.pdf ETL应用浅析.pdf ETL开发实施中质量保证的关键要素V1.0.pdf ETL数据增量抽取方案.pdf ETL数据集成方案初步研究.pdf ETL架构师面试题.pdf ETL流程、数据流图及ETL过程解决方案.pdf ETL流程、...
每款工具都有其独特的优点,选择最适合的ETL工具取决于具体业务需求、技术栈以及资源限制。 在实际应用中,可能还需要考虑与其他系统的集成,例如BI工具、数据湖或数据仓库。此外,随着大数据和云计算的发展,一些...
ETL的实现方法多样,包括使用ETL工具(如 Informatica, Talend, Microsoft SSIS等),SQL编程,或两者结合。ETL工具可快速构建工程但灵活性较低,SQL方式灵活但编码复杂,结合两者则能平衡效率和灵活性。 在实际...
1. **使用ETL工具**:如Oracle的OWB(Oracle Warehouse Builder)、SQL Server的DTS(Data Transformation Services)或SSIS(SQL Server Integration Services)以及Informatica等。这些工具提供了图形化的界面和...
9. **互操作性**:在多元化的IT环境中,ETL工具需要与其他系统,如BI工具、数据科学平台等良好集成,以实现数据的无缝流动和充分利用。 综上所述,大数据ETL工具在数据处理中扮演着核心角色,不仅处理数据的提取、...
在BI ETL过程中,DAC Client是一种重要的维护工具,用于监控和管理BI ETL过程。DAC Client提供了强大的功能,能够实时监控BI ETL过程,检测异常问题,并提供详细的错误信息。 在使用DAC Client时,需要先登录到DAC ...
【大数据分析技术 BI商业智能分析培训】中的第五节主要探讨了久其ETL数据集成工具中的公式...对于希望学习和使用ETL工具的人员,深入理解公式体系和服务器端操作是至关重要的,这将有助于提升数据集成的效率和质量。
这涉及到对久其ETL工具各项功能的实践运用,包括数据连接的创建、控制流和数据流的设计,以及方案的执行。 总的来说,久其ETL数据集成工具教程的这一节主要涵盖了ETL的基本概念、方案创建、数据连接的建立、控制流...
整体来看,《数据仓库ETL工具箱中文版》是一本内容丰富、实用性强的书籍,适合数据仓库和ETL开发人员、项目管理人员以及对BI/DW项目感兴趣的专业人士阅读。通过本书的学习,读者可以掌握一系列技巧和方法,为构建和...
优秀的ETL工具应具备工作流管理、中央元数据存储、数据质量检查、高性能、可扩展性、跨平台和开放API等特点。常见的开源ETL工具有KETL、KETTLE(现为Pentaho的一部分)、Clover ETL和Enhydra Octopus。 - 报表工具...
ETL工具点评.docx ETL常见性能瓶颈.docx ETL构建企业级数据仓库五步法.docx ETL高级教程.docx 三大主流ETL工具选型.docx 什么是ETL.docx 商业智能 通过SSIS设计ETL来将Oracle,DB2,Sybase等数据源的数据定期导入到...
Cognos的产品以模块化套件形式存在,如Powerplay Enterprise Server用于发布和管理Cube,Impromptu提供交互式数据库查询和报表,而Scenario则是ETL工具,用于数据提取、转换和加载。Cognos的解决方案旨在提供全方位...
SQL Server Integration Services (SSIS) 是Microsoft提供的一个ETL工具,广泛应用于构建高效的数据集成解决方案。 SSIS在处理增量数据时展现出了强大的能力。增量处理是指仅处理自上次处理以来发生更改的数据,而...
市面上存在多种ETL工具,它们在功能、性能、易用性和成本方面各具特色,下面将对几种主流的ETL工具进行简要比较: 1. **Informatica PowerCenter** - **优势**:强大的数据集成能力,广泛的数据源支持,高度可扩展...
1.什么是ETL 2.BI项目中ETL设计与思考 3.DataStage(ETL)技术总结 4.ETL常见性能瓶颈 5.ETL高级教程 6.ETL工具点评 7.ETL构建企业级数据仓库五步法 8.ETL增量抽取 ...13.选择合适的ETL工具满足数据整合性能挑战
**ETL工具Kettle简介** Kettle是一款强大的开源ETL(Extract, Transform, Load)工具,由Pentaho公司开发并维护。它以其直观的图形化界面、灵活的数据处理能力和高性能而受到业界广泛欢迎。Kettle是用Java编写的,...
对比分析文档“ETL工具对比分析search.htm”会更详细地阐述每款工具的特点、性能指标以及适用场景,帮助决策者做出最佳选择。 在评估这些工具时,还需要考虑其他因素,如用户界面友好度、可扩展性、性能优化、安全...