数据仓库的基本概念
1.数据仓库概念始于上世纪80年代中期,首次出现是在被誉为“数据仓库之父”WilliamH.Inmon的《建立数据仓库》一书中。随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善,在总结、丰富、集中多行企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合”。数据仓库并没有严格的数据理论基础,也没有成熟的基本模式,且更偏向于工程,具有强烈的工程性。通常按其关键技术部份分为数据的抽取、存储与管理以及数据的表现等三个基本方面。
数据仓库的重点与要求是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供管理人员进行分析使用。数据仓库主要是应用于决策支持系统,其主要目的是“提取”信息并加以扩展,用来进行处理基于数据仓库的决策支持系统(DSS)的应用。
2 基于数据仓库的决策支持系统(DSS)由三个部件组成:数据仓库技术(Data warehousing),联机分析处理技术(OLAP,On—Line Analytical Pro—cessing),数据挖掘技术(Data Mining)。
联机分析处理(OLAP,On—Analytical Pro—cessing)是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业给特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或多维环境特定的查询和报表需求。数据仓库侧重于存储和管理面向决策主题的数据;而OLAP侧重于数据仓库的数据分析,并将其转换成辅助决策信息。OLA P的一个主要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。问此,利用OLAP技术与数据仓库的结合可以较好地解决传统决策支持系统既需要处理大量数据又需要进行大量数值计算的问题。
OLAP的多维数据分析主要通过对多维数据的维进行剖切、钻取和旋转来实现对数据库所提供的数据进行深入分析,为决策者提供决策支持。多维结构是决策支持的支柱,也是OLAP的核心。
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的。模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘可以看成是一种数据搜寻过程,它不必预先假设或提出问题,但是仍能找到那些非预期的却令人关注的信息,这些信息表示了数据元素的关系和模式。它能挖掘出数据键潜在的模式(pattern),找出最有价值的信息和知识(knowledge)。指导商业行为或辅助科学研究。研究对象是大规模和超大规模的数据集合。
数据仓库概念的提出者、美国著名信息工程专家 William Inmon 博士在90年代初提出了数据仓库概念的一个表述。他认为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于对管理决策过程的支持。”
所谓主题,是指用户使用数据仓库进行决策时所关心的重点方面,如:收入、客户、销售渠道等;所谓面向主题,是指数据仓库内的信息是按主题进行组织的,而不是像业务支撑系统那样是按照业务功能进行组织的。
所谓集成,是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息。
所谓随时间变化,是指数据仓库内的信息并不只是反映企业当前的状态,而是记录了从过去某一时点到当前各个阶段的信息。通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
而信息本身相对稳定,是指一旦某个数据进入数据仓库以后,一般很少进行修改,更多的是对信息进行查询操作。
依据上面的定义,有人可能会把数据仓库简单地理解为仅仅是一个大型的数据存储机制,是一个静态的概念。实际上,数据仓库更像一个过程,这个过程涉及数据的收集、整理和加工,生成决策所需要的信息,并且最终把这些信息提供给需要这些信息的使用者,供他们做出改善业务经营的正确决策。数据仓库的重点与要求就是能够准确、安全、可靠地从业务系统中取出数据,经过加工转换成有规律信息之后,供管理人员进行分析使用。因此数据仓库是一个动态的概念,应该称为数据仓库工程(Data Warehousing)。
分享到:
相关推荐
数据仓库基本概念与联机分析处理技术是现代企业信息化建设和数据驱动决策的重要组成部分。数据仓库是一种用于支持管理和决策制定的数据存储系统,它收集并整合来自各种业务系统的数据,以提供全面、一致的数据视图,...
数据仓库的基本概念包括以下几个核心点: 1. **数据仓库的定义**:数据仓库是经过特殊设计的数据库,主要目的是为了报告和数据分析,而不是日常事务处理。它存储的是历史数据,通常是从操作型数据库或其他数据源...
数据仓库基本概念.pptx
数据仓库基本概念(PPT38页).pptx
第一章数据仓库基本概念及通用框架.pptx
数据仓库是专为支持企业或组织决策分析而构建的大规模数据存储和管理系统。它集中存储了来自不同数据源的数据,经过清洗...数据仓库的建设需要经过需求分析、概念设计、逻辑设计和物理设计等多个阶段,以确保其能够满足
2. 概念设计:这一阶段涉及构建数据仓库的逻辑模型,定义主题域(如客户、产品、销售等),并确定每个主题的属性和关系。这些主题域是数据仓库的核心,反映了业务的主要关注点。 3. 逻辑设计:在这个阶段,我们将...
数据仓库是一种特定类型的数据管理系统,它的设计目的是支持企业的决策制定过程。从传统数据库到数据仓库的...随着大数据和云计算技术的发展,数据仓库的概念和技术也在不断演进,以适应更加复杂和多样化的信息需求。
【目录】 1.1 从数据库到数据仓库 1.2 什么是数据仓库 1.3 数据仓库与传统数据库的比较 1.4 数据仓库的系统结构 1.5 数据仓库的数据组织 1.6 本章小结
Chap1 数据仓库基本概念.pdf Chap2 OLAP基本概念.pdf Chap3 数据仓库设计.pdf chap4 维度建模.pdf chap5 数据仓库相关技术.pdf 数据仓库--ETL]渐变维度.docx 数据仓库基础.pdf 数据仓库学习笔记.doc 数据仓库...
数据仓库基本概念 数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。它是通过对企业中的数据进行收集、整理和分析,提供给管理人员一个重要的决策依据。 数据仓库的...
03_数据仓库基本概念 04_数据仓库需求分析和框架选择 05_数据仓库流程设计和数仓分层 06_dataWorks和MaxCompute简单介绍 07_dataWorks购买及创建工作空间 08_数据仓库原始业务表格介绍 09_业务表格同步策略介绍 10_...