`
JAVA海洋
  • 浏览: 618280 次
  • 性别: Icon_minigender_1
  • 来自: 太原
社区版块
存档分类
最新评论
阅读更多
目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

根据数据仓库概念的含义,数据仓库拥有以下四个特点:
1、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。

2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。
整个数据仓库系统是一个包含四个层次的体系结构,具体由下图表示。


数据仓库系统体系结构

·数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等;

·数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。

·OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。

·前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。
分享到:
评论

相关推荐

    数据仓库与数据分析教程ppt.rar

    首先,我们要理解什么是数据仓库。数据仓库是一个专门为决策支持系统设计的集成化、非易失性的数据集合,它存储了组织历史上的数据,通常来自多个不同的源系统。数据仓库的目标是提供一个中心化的存储,使得分析人员...

    数据仓库的概念

    #### 一、什么是数据仓库 数据仓库是一种特殊类型的数据库,它主要用于支持决策制定过程,而非日常的事务处理。数据仓库的主要特点是面向主题、集成性、相对稳定性以及反映历史变化。 1. **面向主题**:数据仓库中...

    Oracle 数据仓库技术白皮书

    ##### 1.1 什么是数据仓库? 数据仓库是由William Inmon博士在90年代初提出的概念,他将其定义为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于支持管理决策...

    2021年企业级大数据项目之数据仓库(专业完整版).pdf

    什么是数据仓库 数据仓库(Data Warehouse)是指一个专门设计用来存储和管理企业级数据的系统,旨在支持商业智能应用,如数据分析、报表生成和数据 mining 等。数据仓库通常来自于各种来源,如数据库、文件、应用...

    数据仓库工程师面试题.docx

    什么是数据仓库? 数据仓库(Data Warehouse)是指一个大型的存储数据的集合,用于解决企业数据分析和决策目的。它将来自多个数据源的数据进行筛选、整合和指导业务流程改进、成本、质量和控制。 数据仓库的特点:...

    数据仓库与数据挖掘教程

    首先,我们来理解什么是数据仓库。数据仓库是一个集中的、结构化的存储系统,用于收集来自多个源的大量数据,并对其进行整合、清理和优化,以便于分析和报告。它的设计目的是支持决策制定过程,提供历史数据的长期...

    漫画:什么是数据仓库?.docx

    数据仓库是企业分析性报表和决策支持的重要工具,它将来自多个数据源的数据进行筛选与整合,从而为企业供应肯定的商业智能(BI)力量。 数据仓库是指一个很大的数据存储集合,用于企业的分析性报表和决策支持目的。...

    韩家炜数据仓库ppt

    ### 一、什么是数据仓库(What is a data warehouse) 数据仓库是一种用于收集、管理和分析大量业务数据的信息系统。它通常用于支持商业智能活动,特别是分析性报告和决策支持。与传统数据库不同,数据仓库中的数据...

    WEB数据仓库--经典

    首先,我们需要理解什么是数据仓库。数据仓库是一个专门设计用于数据分析的系统,它收集、整合并存储来自不同源的数据,为决策制定提供支持。与常规数据库不同,数据仓库通常用于查询和报告,而不是事务处理。 在...

    数据仓库在零售行业中的应用

    首先,让我们来了解什么是数据仓库。数据仓库是一个面向目标的、综合的、随时间而变化的用以支持管理决策的数据集成。它通过将企业内的各种数据源整合起来,提供了一个统一的数据平台,支持企业的管理决策。 在零售...

    经典数据仓库(原书第三版)

    在数据仓库的世界里,首先我们要理解什么是数据仓库。数据仓库是一个用于报告和数据分析的系统,它集成了来自不同源的数据,并以一种对企业决策制定者友好的方式来组织。与操作型数据库不同,数据仓库更侧重于支持...

    数据仓库与联机分析处理技术

    **什么是数据仓库技术** 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策的信息处理。它的主要特点是面向主题、集成性、稳定性以及反映历史变化。 **数据仓库技术与相关...

    数据仓库与数据挖掘(陈志泊)课后习题答案1

    数据仓库与数据挖掘是现代企业决策支持系统的关键组成部分。数据仓库是存储历史数据的系统,设计目的是为了支持决策分析,而数据挖掘则是从大量数据中发现有价值信息的过程。以下是这两个领域的核心概念及其特点: ...

    数据仓库与数据挖掘课程实验

    ### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...

    数据仓库,数据仓库入门

    1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...

    数据仓库与数据挖掘-实验报告 数据仓库的设计、实现及多维分析 共14页.pdf

    数据仓库与数据挖掘是现代信息技术领域中的重要组成部分,它们在数据驱动决策的背景下扮演着关键角色。本实验报告主要探讨了数据仓库的设计、实现及多维分析,涉及到的关键概念包括数据仓库、多维数据模型、ETL过程...

    IBM数据仓库需求建模方法及行业数据仓库模型

    IBM数据仓库需求建模方法及行业数据仓库模型的知识点主要涵盖了数据仓库的建设、企业级数据仓库建模、软硬件配置、行业数据仓库模型以及市场趋势和相关技术。 首先,IBM数据仓库需求建模方法强调了企业级数据仓库...

    数据仓库基本知识

    #### 什么是数据仓库 数据仓库是一种集成的、面向主题的数据集合,其主要目的是支持决策制定而非日常运营。数据仓库通常包含从各种来源抽取、清理、转换并加载到特定格式的数据,以便于进行分析和报告。具体而言,...

Global site tag (gtag.js) - Google Analytics