1.1 什么是数据仓库
业界公认的数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。主题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域:数据仓库的集成特性是指在数据进入数据仓库之前,必须经过数据加工和集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变;数据仓库的稳定性是指数据仓库反映的是历史数据的内,而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后是极少或根本不修改的;数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。
数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。数据仓库是数据库技术的一种新的应用,而且到目前为止,数据仓库还是用关系数据库管理系统来管理其中的数据。
1.2 数据仓库的产生
计算机系统的功能从数值计算扩展到数据管理距今已有三十多年了。最初的数据管理形式主要是文件系统,少量的以数据片段之间增加一些关联和语义而构成层次型或网状数据库,但数据的访问必须依赖于特定的程序,数据的存取方式是固定的、死板的。到了1969年,E.F.Codd博士发表了他著名的关系数据模型的论文。此后,关系数据库的出现开创了数据管理的一个新时代。
近几十年来,大量新技术、新思路的涌现出来并被用于关系型数据库系统的开发和实现:客户/服务器系统结构、存储过程、多线索并发内核、异步I/O、代价优化,等等,这一切足以使得关系数据库系统的处理能力毫不逊色于传统封闭的数据库系统。而关系数据库在访问逻辑和应用上所带来的好处则远远不止这些,SQL的使用已成为一个不可阻挡的潮流,加上近些年来计算机硬件的处理能力呈数量级的递增,关系数据库最终成为联机事务处理系统的主宰。
整个80年代直到90年代初,联机事务处理一直是数据库应用的主流。然而,应用在不断地进步。当联机事务处理系统应用到一定阶段后,用户便发现单靠拥有联机事务处理已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的情况进行分析,而做出有利的决策。这种决策需要对大量的业务数据包括历史业务数据进行分析才能得到。在如今这样激烈的市场竞争环境下,这种基于业务数据的决策分析,我们把它称为联机分析处理,比以往任何时候都显得更为重要。如果说传统联机事务处理强调的是更新数据库--向数据库中添加信息,那么联机分析处理就是从数据库中获取信息、利用信息。因此,著名的数据仓库专家Ralph Kimball写道:"我们花了二十多年的时间将数据放入数据库,如今是该将它们拿出来的时候了。"
分享到:
相关推荐
数据仓库技术是数据库领域的重要分支,它主要针对分析型处理需求,为企业决策提供支持。传统的数据库技术主要关注操作型处理,即事务处理,这涉及到对数据库的日常查询和修改,强调快速响应、数据安全和完整性。然而...
### 数据仓库技术架构及...综上所述,Teradata不仅在数据仓库领域具有深厚的技术积累和市场领先地位,还通过其先进的架构设计和完整的解决方案,为企业提供了强大的数据分析能力,帮助它们更好地理解和利用数据价值。
(整理)(整理)11数据仓库技术简介.pdf仓库技术简介.pdf(整理)数据仓库技术简介.pdf
(整理)(整理)11数据仓库技术简介.docx仓库技术简介.docx(整理)数据仓库技术简介.docx
数据仓库技术简介.doc
第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 2.6 样本数据库 34 2.7 数据分割 35 2.8 ...
本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。 目录 译者序 审、译者简介 前言 第1章 决策支持系统的...
通过对Teradata数据仓库技术架构的深入理解,我们可以看到其在数据架构设计、整体架构构建以及ETL架构实现上的专业性和高效性。Teradata以强大的系统扩展能力和模块化设计,为企业级数据仓库领域提供了有力的技术...
综上所述,数据仓库与联机分析处理技术是现代企业信息化建设的重要组成部分,它们不仅帮助企业更好地理解和利用积累的大量数据,还为企业提供了强大的决策支持能力。随着技术的不断进步和发展,数据仓库和OLAP技术将...
6.11 在多种层次上建造数据仓库 134 6.12 多个小组建立当前细节级 136 6.12.1 不同层不同需求 138 6.12.2 其他类型的细节数据 140 6.12.3 元数据 142 6.13 公用细节数据采用多种平台 142 6.14 小结 143 ...
第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 2.6 样本数据库 34 2.7 数据分割 35 2.8 ...
目前,市场上有多种数据仓库产品,以下是一些主流的数据仓库产品: * BusinessObjects(BO)数据仓库解决方案 * IBM 数据仓库解决方案 * Oracle 数据仓库解决方案 * Sybase 数据仓库解决方案 * Infomix 数据仓库...
### 一、《数据仓库生命周期工具箱》简介 #### 1. 数据仓库基础概念 - **定义**: 首先介绍了数据仓库领域内的一些基本概念,并对这些术语进行了明确界定。例如,“数据仓库”这一术语在不同的背景下可能会有不同的...
本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。 目录 译者序 审、译者简介 前言 第1章 决策支持系统的...
### 数据仓库及其应用 #### 15.1 数据仓库发展的...综上所述,数据仓库是一项复杂但至关重要的技术,它为企业提供了管理和分析海量数据的强大工具。通过合理设计和实施数据仓库,企业可以提高决策效率,增强竞争力。
#### 第1章 数据仓库和数据挖掘简介 **1.1 数据简介** 在本部分中,作者简要介绍了所使用的数据集来源及其特点。该实验涉及到两个数据集: - **超市交易数据集**:主要用于进行关联规则分析。虽然文本未提供详细...
数据仓库技术介绍(PPT 100页).ppt