数据仓库是近年来兴起的一种新的数据库应用。在各大数据库厂商纷纷宣布产品支持数据仓库并提出一整套用以建立和使用数据仓库的产品是,业界掀起了数据库热。比如INFORMIXGONGSIDE公司的数据仓库解决方案;ORACLE公司的数据仓库解决方案;Sybase公司的交互式数据仓库解决方案等等。这同时也引起了学术界的极大兴趣,国际上许多重要的学术会议,如超大型数据库国际会议(VLDB),数据工程国际会议(Data Engineering)等,都出现了专门研究数据仓库(Data Warehousing,简记为DW)、联机分析处理(On-Line Analytical Processing,简记为OLAP)、数据挖掘(Data Mining, 简记为DM)的论文。对我国许多企业而言,在建立或发展自己的信息系统常常困扰于这样的问题:为什么要在原有的数据库上建立数据仓库?数据仓库能否代替传统的数据库?怎样建立数据仓库?等等。本章将简要介绍一下用到的数据仓库技术背景,并在下一章结合数据清理系统设计实例,更深一步阐述数据仓库技术在现实中的重大意义。
一、从数据库到数据仓库
传统的数据库技术是以单一的数据资源,即数据库为中心,进行事务处理、批处理、决策分析等各种数据处理工作,主要的划分为两大类:操作型处理和分析型处理(或信息型处理)。 操作型处理也叫事务处理,是指对数据库联机的日常操作,通常是对一个或一组纪录的查询和修改,主要为企业的特定应用服务的,注重响应时间,数据的安全性和完整性;分析型处理则用于管理人员的决策分析,经常要访问大量的历史数据。而传统数据库系统优于企业的日常事务处理工作,而难于实现对数据分析处理要求,已经无法满足数据处理多样化的要求。操作型处理和分析型处理的分离成为必然。
近年来,随着数据库技术的应用和发展,人们尝试对DB中的数据进行再加工,形成一个综合的,面向分析的环境,以更好支持决策分析,从而形成了数据仓库技术(Data Warehousing,简称DW)。作为决策支持系统(Decision-making Support System,简称DSS),数据仓库系统包括:
① 数据仓库技术;
② 联机分析处理技术(On-Line Analytical Processing,简称OLAP);
③ 数据挖掘技术(Data Mining,简称DM);
数据仓库弥补了原有的数据库的缺点,将原来的以单一数据库为中心的数据环境发展为一种新环境:体系化环境。如图1.1所示:
分享到:
相关推荐
数据仓库技术是数据库领域的重要分支,它主要针对分析型处理需求,为企业决策提供支持。传统的数据库技术主要关注操作型处理,即事务处理,这涉及到对数据库的日常查询和修改,强调快速响应、数据安全和完整性。然而...
### 数据仓库技术架构及...综上所述,Teradata不仅在数据仓库领域具有深厚的技术积累和市场领先地位,还通过其先进的架构设计和完整的解决方案,为企业提供了强大的数据分析能力,帮助它们更好地理解和利用数据价值。
数据仓库技术简介.doc
6.11 在多种层次上建造数据仓库 134 6.12 多个小组建立当前细节级 136 6.12.1 不同层不同需求 138 6.12.2 其他类型的细节数据 140 6.12.3 元数据 142 6.13 公用细节数据采用多种平台 142 6.14 小结 143 第7章 高级...
本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。 目录 译者序 审、译者简介 前言 第1章 决策支持系统的...
通过对Teradata数据仓库技术架构的深入理解,我们可以看到其在数据架构设计、整体架构构建以及ETL架构实现上的专业性和高效性。Teradata以强大的系统扩展能力和模块化设计,为企业级数据仓库领域提供了有力的技术...
综上所述,数据仓库与联机分析处理技术是现代企业信息化建设的重要组成部分,它们不仅帮助企业更好地理解和利用积累的大量数据,还为企业提供了强大的决策支持能力。随着技术的不断进步和发展,数据仓库和OLAP技术将...
6.11 在多种层次上建造数据仓库 134 6.12 多个小组建立当前细节级 136 6.12.1 不同层不同需求 138 6.12.2 其他类型的细节数据 140 6.12.3 元数据 142 6.13 公用细节数据采用多种平台 142 6.14 小结 143 ...
目前,市场上有多种数据仓库产品,以下是一些主流的数据仓库产品: * BusinessObjects(BO)数据仓库解决方案 * IBM 数据仓库解决方案 * Oracle 数据仓库解决方案 * Sybase 数据仓库解决方案 * Infomix 数据仓库...
### 一、《数据仓库生命周期工具箱》简介 #### 1. 数据仓库基础概念 - **定义**: 首先介绍了数据仓库领域内的一些基本概念,并对这些术语进行了明确界定。例如,“数据仓库”这一术语在不同的背景下可能会有不同的...
本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。 目录 译者序 审、译者简介 前言 第1章 决策支持系统的...
### 数据仓库及其应用 #### 15.1 数据仓库发展的...综上所述,数据仓库是一项复杂但至关重要的技术,它为企业提供了管理和分析海量数据的强大工具。通过合理设计和实施数据仓库,企业可以提高决策效率,增强竞争力。
1. 数据抽取:这是将数据从各种来源(如操作型数据库、外部文件等)导入到数据仓库的过程。这个阶段涉及到数据的互连、复制、增量加载、转换(清洗和转换成适合分析的格式)以及调度和监控。数据抽取可以定期进行,...
#### 第1章 数据仓库和数据挖掘简介 **1.1 数据简介** 在本部分中,作者简要介绍了所使用的数据集来源及其特点。该实验涉及到两个数据集: - **超市交易数据集**:主要用于进行关联规则分析。虽然文本未提供详细...
根据提供的信息,我们可以总结出以下关于《数据仓库工具箱》第...综上所述,《数据仓库工具箱》第三版是一本全面涵盖数据仓库理论与实践的权威指南,对于希望深入了解这一领域的专业人士来说,是一本不可或缺的参考书。
数据仓库技术架构及方案 数据仓库技术架构及方案是一种复杂的技术架构,旨在提供一个集成的企业级数据仓库解决方案。以下是该架构的详细介绍: Teradata 简介 Teradata 是一家全球领先的数据仓库解决方案提供商,...
数据仓库技术介绍(PPT 100页).ppt