IBM、Oracle、Sybase、CA、NCR、Informix、Microsoft、和SAS等有实力的公司相继(通过收购或研发的途径)推出了 自己的数据仓库解决方案,BO和Brio等专业软件公司也在前端在线分析处理工具市场上占有一席之地。下面针对这些数据仓库解决方案的性能和特点做分析和 比较。
IBM IBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:Visual Warehouse(VW)、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS)。其中,VW是一个功能很强的集成环境,既可用于数据仓库建模和元数据管 理,又可用于数据抽取、转换、装载和调度。Essbase/DB2 OLAP Server支持“维”的定义和数据装载。Essbase/DB2 OLAP Server不是ROLAP(Relational OLAP)服务器,而是一个(ROLAP和MOLAP)混合的HOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2 UDB数据库中。
严格说来,IBM自己并没有提供完整的数据仓库解决方案,该公司采取的是合作伙伴战略。例如,它的前端数据展现工具可以是Business Objects的BO、Lotus的Approach、Cognos的Impromptu或IBM的Query Management Facility;多维分析工具支持Arbor Software的Essbase和IBM(与Arbor联合开发)的DB2 OLAP服务器;统计分析工具采用SAS系统。
Oracle Oracle数据仓库解决方案主要包括Oracle Express和Oracle Discoverer两个部分。Oracle Express由四个工具组成:Oracle Express Server是一个MOLAP (多维OLAP)服务器,它利用多维模型,存储和管理多维数据库或多维高速缓存,同时也能够访问多种关系数据库;Oracle Express Web Agent通过CGI或Web插件支持基于Web的动态多维数据展现;Oracle Express Objects前端数据分析工具(目前仅支持Windows平台)提供了图形化建模和假设分析功能,支持可视化开发和事件驱动编程技术,提供了兼容 Visual Basic语法的语言,支持OCX和OLE;Oracle Express Analyzer是通用的、面向最终用户的报告和分析工具(目前仅支持Windows平台)。Oracle Discoverer即席查询工具是专门为最终用户设计的,分为最终用户版和管理员版。
在Oracle数据仓库解决方案实施过程中,通常把汇总数据存储在Express多维数据库中,而将详细数据存储在Oracle关系数据库中,当需要详细 数据时,Express Server通过构造SQL语句访问关系数据库。但目前的Express还不够灵活,数据仓库设计的一个变化往往导致数据库的重构。另外,目前的 Oracle 8i和Express 之间集成度还不够高,Oracle 8i和Express之间需要复制元数据,如果Oracle Discoverer(或BO)需要访问汇总数据,则需要将汇总数据同时存放在Oracle和Express中,系统维护比较困难。值得注意的是,刚刚问 世的Oracle 9i把OLAP和数据挖掘作为重要特点。
Sybase Sybase提供的数据仓库解决方案称为Warehouse Studio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。其中,Warehouse Architect是PowerDesigner中的一个设计模块,它支持星形模型、雪花模型和ER模型;数据抽取与转换工具包括PowerStage、 Replication Server、Carleton PASSPORT,PowerStage是Sybase提供的可视化数据迁移工具。
Adaptive Server Enterprise是Sybase企业级关系数据库,Adaptive Server IQ是Sybase公司专为数据仓库设计的关系数据库,它为高性能决策支持系统和数据仓库的建立作了优化处理,Sybase IQ支持各种流行的前端展现工具(如Cognos Impromptu、Business Objects、Brio Query等);数据分析与展现工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo 等,PowerDimensions是图形化的OLAP分析工具,它支持SMP和多维缓存技术,能够集成异构的关系型数据仓库和分布式数据集市,从而形成 单一的、新型的多维模式;数据仓库的维护与管理工具包括Warehouse Control Center、Sybase Central、Distribution Director,其中Warehouse Control Center是为数据仓库开发人员提供的元数据管理工具。
Sybase提供了完整的数据仓库解决方案Quick Start DataMart,具有良好的性能,并支持第三方数据展现工具。从Quick Start DataMart的名称不难看出,它尤其适合于数据集市应用。另外,Sybase可以提供面向电信、金融、保险、医疗保健这4个行业的客户关系管理 (CRM)产品,在这4个产品中,有80%的功能是共性的,有20%的功能需要Sybase与合作伙伴针对不同需求共同开发。
Informix Informix于1998和1999年相继收购了国际上享有盛誉的数据仓库供应商Red Brick System和数据管理软件供应商Ardent,并提供了完整、集成的数据仓库解决方案。该解决方案还包括一个“快速启动”咨询服务,能够帮助用户快速完 成数据仓库或数据集市的开发。Informix产品能够集成Microsoft IIS或Netscape Enterprise/FastTrack服务器,从而支持基于Web的数据仓库应用。
Informix没有提供自己的报表和数据挖掘工具,但他们与Brio和SAS公司建立了战略联盟,并推出了“Informix商务智能联盟计划”。该计 划以Informix为主,结合Brio的前端数据分析和报表功能,以及SAS的数据挖掘功能,形成了一个“BI中心”打包方案。
(今年4月Informix Software已被IBM公司收购,此举将给IBM公司数据库及数据仓库产品,从技术和市场占有率上带来极大的提升。)
CA CA于1999年收购了Platinum Technology公司后,得到了完整的数据仓库解决方案,包括:Erwin数据仓库设计工具、InfoPump数据转换与抽取工具、 InfoBeacon ROLAP服务器、Forest&Trees前端数据展现工具、Provision系统监视与作业调度工具和DecisionBase元数据管理工具等。
与Informix解决方案相似,CA解决方案也提供了数据仓库建模、元数据管理、数据抽取与转换、基于关系数据库的在线分析服务器、系统监视与作业调 度、前端数据展现等功能,同时还支持Web应用。不同之处是Informix提供了专门为数据仓库设计的高性能目标数据库(Red Birck),而CA解决方案则提供ODBC接口,并将数据存储在第三方关系数据库(如Oracle、Sybase、SQL Server、Informix和IBM DB2等)中,其性能要打一些折扣,但开放性要好些。另外,CA的OLAP服务器目前只能与Microsoft的IIS Web服务器集成。
NCR Teradata NCR Teradata是高端数据仓库市场最有力的竞争者,主要运行在NCR WorldMark SMP硬件的Unix操作系统平台上。1998年,该公司也提供了基于Windows NT的Teradata,试图开拓数据集市(Data Mart)市场。总的来看,NCR的产品性能很好,Teradata数据仓库在100GB、300GB、1TB和3TB级的TPC D指标测试中均创世界纪录。但是,NCR产品的价格相对较高,中小企业用户难以接受。
Microsoft Microsoft将OLAP功能集成到Microsoft SQL Server 7.0中,提供可扩充的基于COM的OLAP接口。它通过一系列服务程序支持数据仓库应用。数据传输服务DTS(Data Transformation Services)提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与Microsoft Repository集成,共享有关的元数据;Microsoft Repository存储包括元数据在内的所有中间数据;SQL Server OLAP Services支持在线分析处理;PivotTable Services提供客户端OLAP数据访问功能,通过这一服务,开发人员可以用VB或其他语言开发用户前端数据展现程序,PivotTable Services还允许在本地客户机上存储数据;MMC(Microsoft Management Console)提供日程安排、存储管理、性能监测、报警和通知的核心管理服务;Microsoft Office 2000套件中的Access和Excel可以作为数据展现工具,另外SQL Server还支持第三方数据展现工具。
SAS SAS公司在20世纪70年代以“统计分析”和“线性数学模型”而享誉业界,90年代以后,SAS公司也加入了数据仓库市场的竞争,并提供了特点鲜明的数 据仓库解决方案,包括30多个专用模块。其中,SAS/WA(Warehouse Administrator)是建立数据仓库的集成管理工具,包括定义主题、数据转换与汇总、更新汇总数据、元数据管理、数据集市的实现 等;SAS/MDDB是SAS用于在线分析的多维数据库服务器;SAS/AF提供了屏幕设计功能和用于开发的SCL(屏幕控制语言);SAS /ITSV(IT Service Vision)是IT服务的性能评估和管理的软件,这些IT服务包括计算机系统、网络系统、Web服务器和电话系统等。SAS系统的优点是功能强、性能 高、特长突出,缺点是系统比较复杂。
Business Objects Business Objects(BO)是集查询、报表和OLAP技术为一身的智能决策支持系统。它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数 据,具有较好的查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种数据库,同时它还支持基于Web浏览器的查询、报表和分析决策。虽然BO 在不断增加新的功能,但从严格意义上说,BO只能算是一个前端工具。也许正因为如此,几乎所有的数据仓库解决方案都把BO作为可选的数据展现工具。
虽然国内有很多大学和研究机构从事数据仓库技术的研究,但到目前为止,国内基本上没有成熟的数据仓库解决方案。
相关推荐
银行大数据解决方案 银行大数据解决方案是指银行业为应对大数据时代的到来,采取了一系列措施来整合和分析大量的数据资源,以提高业务效率、降低风险和增强竞争力。该解决方案的出现是基于《促进大数据发展的行动...
AWS大数据解决方案通过一系列服务,针对这些大数据特点提供了解决之道。首先,在数据产生层面, AWS 提供了弹性、高扩展性的基础设施,允许企业无需前期投入和固定投资,而能够根据实际的使用量付费,同时按需扩展...
### 星环大数据解决方案 #### 一、星环科技简介及发展历程 星环科技作为一家致力于提供大数据与人工智能解决方案的企业,在行业中占据着重要的地位。公司成立于2013年,自成立以来,一直专注于研发高性能的大数据...
"大数据解决方案" 大数据解决方案是指通过各种技术和工具对大量数据进行收集、存储、处理和分析,以获取有价值的信息和知识的解决方案。大数据解决方案通常包括数据采集、数据存储、数据处理和数据分析四个方面。 ...
医疗大数据解决方案 医疗大数据解决方案是基于大数据技术和人工智能技术的医疗信息系统解决方案,旨在解决医疗行业中的数据爆炸问题,并提高医疗服务质量和效率。该解决方案结合了大数据技术、人工智能技术和信息...
某集团大数据平台整体方案建议书 大数据平台整体方案建议书是某集团推出的完整的大数据方案,该方案包括了大数据平台的建设背景、建设目标、与相关系统的关系等多个方面的内容。以下是对该方案的详细解读和知识点...
在大数据领域中,Oracle提供了多种解决方案,包括数据仓库、数据挖掘、数据分析和数据可视化等。这些解决方案可以帮助企业更好地处理和分析大数据,从而获取有价值的信息和见解。 同时,Oracle的大数据解决方案还...
4. **数据仓库与大数据集成**:传统数据仓库架构可能无法应对大数据的挑战。Oracle提供了与大数据集成的解决方案,如Oracle Exadata,它能够处理结构化数据并与其他大数据平台(如Hadoop)无缝集成,实现大数据的...
该方案结合了金融商贸领域的特点,充分利用大数据的技术优势,为金融机构提供数据分析、风险控制、客户关系管理、业务创新等多方面的支持。 在大数据技术应用方面,华为金融大数据解决方案涵盖了以下几个核心知识点...
大数据,顾名思义,是指具有巨量、多样化、快速和价值密度低等特点的数据集合。在行车系统中,大数据的应用涉及到车辆终端产生的大量数据,包括非结构化的日志、图片、视频和音频等,这些数据的快速增长对系统的处理...
本文档主要介绍了POWER大数据解决方案的基本概念、架构设计、技术特点和应用场景。POWER大数据解决方案是由IBM推出的,旨在解决当前大数据时代的计算挑战。该解决方案基于POWER8处理器,具有高性能、低延迟、灵活的...
Oracle大数据解决方案和最佳实践是甲骨文公司为解决企业大数据处理需求而提供的一个端到端的解决方案。该方案旨在帮助企业从海量、多样化、高速生成的大数据中提取价值,以优化业务决策过程,提高企业竞争力。 首先...
从最初的数据仓库到现在的云计算、大数据、人工智能等技术,整个大数据技术栈正在不断演进和更新。随着技术的发展,大数据应用解决方案也变得越来越重要,成为企业实现商业价值的关键手段。 大数据应用 大数据应用...
2. 数据存储:大数据具有体量大、增长快、种类多的特点,因此需要采用高性能的存储技术,如分布式文件系统(Hadoop HDFS)、云存储解决方案等。 3. 数据处理与分析:处理技术包括实时计算和批量处理。实时计算要求...
根据提供的文件信息,以下是关于“基于数加的大数据仓库解决方案”的详细知识点概述: 首先,“数加”应是指某种平台或技术框架的名称,而“大数据仓库解决方案”则指向在大数据环境下,对于存储、管理和分析数据的...
Hive大数据仓库知识点 Hive是一种基于Hadoop的大数据仓库工具,可以将结构化的数据文件映射为一个表,并提供类SQL查询功能。Hive的优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计。延迟较高,...
招聘行业大数据解决方案旨在应对当前招聘行业的痛点,提升服务质量,满足新一代求职者的需求。随着互联网的发展,招聘服务虽然扩展了服务场景,但本质上仍停留在信息聚合和中介的角色,未能实质性提高用户体验。求职...
Oracle的大数据解决方案注重数据集成和管理,提供全面的数据平台,包括Hadoop集成、NoSQL数据库和数据仓库优化等。IBM的大数据解决方案则强调信息管理、分析能力和云服务,通过其Bluemix平台提供大数据分析工具和...
本文将深入探讨大数据的特点、大数据与云计算的关系、行车系统的现状与需求,以及具体的解决方案。 大数据的特点包括三个方面:体积(Volumn)、多样性和速度(Variety & Velocity)。巨大的数据量来自众多终端设备...