数据仓库与OLAP相关
一、数据仓库的定义
(一)数据仓库的定义
数据仓库的定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合
1.面向主题的
是相对传统数据库面向应用而言的,面向应用就是指的系统实现过程中主要围绕一些应用或功能,而面向主题,我们可以这样理解,因为数据仓库就是为了解决一个问题,而把数据集成在一起的,而这个问题就可以理解为主题。
2.集成的
我们可以理解为数据仓库中的数据来自各个不同的数据源,他们的结构可能是不同的,所以在这些数据进入到数据仓库之前,必须经历一个集成的过程。把数据转换为统一的表达方式,比如表示性别,可以为男/女,也可以表示为f/m。
3.与时间相关的
我们可以理解为数据仓库中的数据以时间为一个维度进行组织。
4.不可修改的
数据仓库中的数据一般不进行,数据仓库中的数据仅限于数据的初始导入和记录查询。
(二)数据仓库与数据库的区别
我的理解是:这两者是平级的技术,只不过他们的应用不同,数据库是针对操作性数据,也就是针对增删改查,为了存储与业务相关的数据的一项技术,而数据仓库则是为了解决某一个问题,而把相应数据集成在一起,从而进行对决策进行支持的一项技术。
(三)数据仓库结构
数据仓库由近期基本数据、历史基本数据、轻度综合数据、高度综合数据。
1.这里要知道一个概念,就是元数据,我们可以理解其为描述数据的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。也就是说元数据是描述了数据仓库的数据。
2.此外这里的综合数据和基本详细数据的区别就在于粒度上,比如基本详细数据是记录每次电话记录情况的数据,而综合数据则是记录一个月的数据。
(四)数据集市及其结构
1.什么是数据集市,就是部门级的数据仓库,一般只为某个局部范围内的管理人员服务。但要注意数据集市不是单纯的更小的数据仓库。尺寸的大小并不是区分数据仓库和数据集市的本质特质,数据集市的数据模型一定是满足应用的特定的需求的。
(五)数据仓库系统结构
1.这里要区分数据仓库结构,数据仓库结构是说数据仓库中的数据的结构,而这里是数据仓库系统的结构,包含,数据仓库,仓库管理和分析工具。
2.数据仓库的运行结构:典型的C/S结构,这里要注意OLAP的三层C/S结构,在普通客户端和数据仓库服务器之间加了一个OLAP服务层,加强和规范化决策支持的服务工作,集中和简化了原客户端和数据仓库服务器德部分工作,降低了系统数据传输量。
3.数据仓库的数据模型
数据仓库的数据等于事实数据加维度数据,事实表(大表)存放大量关于企业的事实数据,维表(小表)存放描述性数据。
我的理解是事实表是联系事实与维度表的表,事实表不应该包含描述性信息,而维度表恰恰就是描述事实表中的数据。具体可参见
http://www.blogjava.net/fanjs2000/archive/2012/05/03/377309.html
4.数据抽取、转换、装载:数据仓库中的数据来源于不同的数据源,所以数据仓库的数据获取需要经过抽取,转换,装载三个过程。
二、联机分析处理
OLAP是数据仓库系统中的一个十分重要的工具.它是以数据仓库为基础的分析技术。
(一)OLAP的概念
1.注意OLAP的两个特点,一个是在线,也就是基于C/S这种结构,第二是多维处理。所以,OLAP,联机分析处理是共享多维信息的快速分析。
2.OLAP和数据挖掘的比较,首先,他们都是数据库(数据仓库)的分析工具,不同之处在于在实际中,前者是验证型的,后者是挖掘型的,此外OLAP重视执行效率和对用户请求的及时响应,而且数据源一般是仓库,而后者是建立在各种数据源的基础上,并不要求执行效率和速度,旨在发现对我们有用的模式,或者说对我们有用的信息。
(二)多维数据分析的
1.切片:三维数据,通过“切片” ,分别从城市和产品等不同的角度观察销售情况。也就是固定住一个维度,去进行分析
2.切块:在多维数组的某一个维上选定某一区间的维成员的操作。
3.钻取:钻取有向下钻取(drill down )和向上钻取(drill up,也称为上卷 )操作,向下就是细化,向上是总结。
4.旋转:通过旋转可以得到不同视角的数据。旋转操作相当于平面数据将坐标轴旋转。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去。或是把页面显示中的一个维和页面外的维进行交换。
分享到:
相关推荐
数据仓库与在线分析处理(OLAP)是信息技术领域中的关键组成部分,主要用于大数据的存储、管理和分析。本实验旨在深入理解这两个概念以及它们在实际应用中的作用。通过参与实验,你可以获得以下关键知识点: 1. **...
数据仓库与OLAP技术在现代企业决策支持系统中扮演着至关重要的角色,它们帮助企业从海量数据中提炼出有价值的信息,从而做出更加明智的决策。以下是对数据仓库与OLAP技术的深入探讨,涵盖其概念、功能、优势及应用...
#### 二、数据仓库、OLAP和数据挖掘在银行业的应用与比较 1. **数据仓库设计** - 银行在进行数据仓库设计时,会考虑到数据的集成性和一致性。设计过程中需要确保数据的准确性、完整性和及时性,以便为后续的OLAP...
数据仓库与在线分析处理(OLAP)是信息技术领域中的核心概念,主要应用于大数据分析和决策支持系统。在这个实验教程中,我们将深入理解这两个概念,并通过实际操作来掌握相关技术。 **数据仓库** 数据仓库(Data ...
数据仓库与OLAP技术是企业决策支持的关键组成部分。数据仓库,由W.H. Inmon首次提出,是一个专门设计用于分析处理的、集中的、稳定的数据集合,与操作型数据库(DB)区分开来,用于支持企业的决策过程。数据仓库体系...
数据仓库与OLAP实践教程
《构建基于FoodMart数据库的数据仓库与OLAP》 在当今商业环境中,数据分析和决策支持的重要性日益凸显。数据仓库和OLAP(在线分析处理)技术为此提供了强大的工具。本实验主要探讨如何基于FoodMart数据库构建一个...
1. **面向主题(Subject Oriented)**:与事务处理系统不同,数据仓库围绕特定业务领域的主题组织数据,如销售、客户、产品等。 2. **集成的(Integrated)**:数据仓库将来自多个异构数据源的数据统一整合,消除...
基于数据仓库和OLAP技术的聚类挖掘系统的设计与实现.nh
在本文中,我们将深入探讨数据挖掘的基本概念,以及它与数据仓库和在线分析处理(OLAP)的关系。 首先,我们来了解数据挖掘的核心概念。数据挖掘可以分为两大类:监督学习和无监督学习。监督学习包括分类(如决策树...
通过与数据仓库和OLAP结合,企业能够从海量数据中提炼出有价值的洞察,驱动更明智的决策和创新。 总的来说,数据仓库技术与OLAP、数据挖掘概念和技术共同构建了现代商业智能的基础。掌握这些知识对于理解和利用企业...
数据仓库和OLAP是企业数据分析领域中的核心概念,它们为企业决策提供强有力的支持。数据仓库是一个设计用于高效分析的中央化存储系统,它整合了来自多个业务系统的数据,使其能够进行复杂的查询和分析。 数据仓库的...
此外,阅读相关教材和参考书籍,如《数据仓库》、《数据仓库与OLAP实践教程》等,以及关注Microsoft SQL Server等主流商业智能工具的官方文档和在线资源,都能有助于深入学习和掌握这一领域的知识。 随着大数据和...
数据仓库是一个专门设计用于决策支持的数据库,与企业的操作数据库相独立。Inmon的定义指出,数据仓库是一个面向主题的、集成的、随时间变化的且不易丢失的数据集合,它的目标是服务于管理层的决策。面向主题意味着...
【大数据分析与大数据挖掘课程】本课程专注于讲解数据仓库与数据挖掘的相关知识,适合初学者或需要复习的同学。课程内容详尽,逐步深入,涵盖数据仓库的构建、数据的存储和处理,以及数据挖掘的基础理论和技术应用。...
"SQL Server 2000中的数据仓库和OLAP解决方案.pdf" 本文主要介绍了 SQL Server 2000 中的数据仓库和 OLAP 解决方案。数据仓库是一种海量数据存储能力的技术,能够支持多维数据分析和数据挖掘技术,实现决策支持功能...
数据仓库与在线分析处理(OLAP)是信息技术领域的重要组成部分,尤其在大数据和商业智能的背景下,它们的作用愈发显著。本章将详细阐述这两个概念及其相关技术。 首先,数据仓库是一个专门为决策支持服务设计的系统...
在数据仓库中,OLAP(Online Analytical Processing)是核心组件之一,它允许用户对大量数据进行多维分析和快速查询。OLAP的操作包括切片(Slicing)、 dice(Dicing)、钻取(Drilling)、旋转(Pivoting)和聚合...