目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。 根据数据仓库概念的含义,数据仓库拥有以下四个特点:
1、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。
整个数据仓库系统是一个包含四个层次的体系结构,具体由下图表示。
数据仓库系统体系结构
·数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等;
·数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。
·OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。
·前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。
分享到:
相关推荐
### 数据仓库技术架构及方案 #### Teradata简介 Teradata是一家全球领先的数据仓库解决方案提供商,成立于1979年,并于2007年10月1日在纽约证券交易所上市,股票代码为“TDC”。作为企业级数据仓库领域的领导者,...
数据仓库技术是现代商业智能(BI)领域中的关键组成部分,对于理解和分析企业数据至关重要。它是一种专门设计用于支持决策制定的系统,集成了来自不同源的大量历史数据,并且优化了查询和分析性能。本篇文章将深入...
数据仓库技术介绍(99页).pdf 数仓建模指标体系解析.docx 数据仓库建设规范模板.docx 数据仓库技术架构及方案(60页).pptx 数据仓库模板-指标体系梳理.xlsx 数据仓库模板-业务梳理.xlsx 数仓建设及数据治理的超全...
数据仓库技术原理和实践相结合的书。很有实用价值!!
### Oracle 数据仓库技术白皮书知识点解析 #### 1. 数据仓库概述 ##### 1.1 什么是数据仓库? 数据仓库是由William Inmon博士在90年代初提出的概念,他将其定义为:“一个数据仓库通常是一个面向主题的、集成的、...
数据仓库技术是一种关键的IT解决方案,主要用于从海量的、分散的、多源的业务数据中提取有价值的信息,为企业决策提供支持。数据仓库的出现源于企业对数据管理和分析的需求,特别是在面对日益激烈的市场竞争时,企业...
数据仓库技术是数据库领域的重要分支,它主要针对分析型处理需求,为企业决策提供支持。传统的数据库技术主要关注操作型处理,即事务处理,这涉及到对数据库的日常查询和修改,强调快速响应、数据安全和完整性。然而...
### 数据仓库技术与工具概述 数据仓库作为现代企业数据分析的核心组成部分,在推动业务决策过程中发挥着不可或缺的作用。本文将深入探讨数据仓库的相关概念及其所涉及的关键技术与工具。 #### 数据仓库的概念与...
数据仓库技术介绍 数据仓库,作为一个专为决策支持系统(Decision Support Systems, DSS)和联机分析应用(Online Analytical Processing, OLAP)提供数据的结构化数据环境,是现代企业管理和决策的重要工具。其...
数据仓库技术介绍 数据仓库(Data Warehouse)是一种专门设计用于支持决策制定的系统,它集成了来自多个异构数据源的大量历史数据,并且以一种结构化的形式存储,便于数据分析和挖掘。数据仓库的主要目标是从海量的...
数据仓库技术\电子商务中的技术
数据仓库技术在数据存储与数据处理中的应用.pdf 数据仓库技术是近年来新兴起来的建立在原有数据库基础上的技术。传统的数据库技术是单一的数据资源,即以数据库为中心,进行从事务处理、批处理到决策分析的各种类型...
### 数据仓库技术概述 #### 一、数据仓库的背景与概念 随着信息技术的快速发展和数据库技术的日益成熟,企业不仅能够高效地存储大量数据,还能通过先进的系统进行数据分析。这其中包括了早期的关系数据库(RDB)、...
### 数据仓库技术在大众点评网的实践和案例分享 #### 一、背景介绍与行业发展历程 数据仓库技术作为现代企业数据分析的重要组成部分,在过去几十年里经历了快速的发展与变革。从1980年代初的传统OLTP(联机事务...