联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。
当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。下表列出了OLTP与OLAP之间的比较。
|
|
OLTP
|
OLAP
|
用户
|
操作人员,低层管理人员
|
决策人员,高级管理人员
|
功能
|
日常操作处理
|
分析决策
|
DB 设计
|
面向应用
|
面向主题
|
数据
|
当前的, 最新的细节的, 二维的分立的
|
历史的, 聚集的, 多维的集成的, 统一的
|
存取
|
读/写数十条记录
|
读上百万条记录
|
工作单位
|
简单的事务
|
复杂的查询
|
用户数
|
上千个
|
上百个
|
DB 大小
|
100MB-GB
|
100GB-TB
|
|
OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。
“维”是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。因此OLAP也可以说是多维数据分析工具的集合。
OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through等。
·钻取是改变维的层次,变换分析的粒度。它包括向上钻取(roll up)和向下钻取(drill down)。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。
·切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。
·旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。
OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP、MOLAP、HOLAP。
ROLAP表示基于关系数据库的OLAP实现(Relational OLAP)。以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成了"星型模式"。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩展称为"雪花模式"。
MOLAP表示基于多维数据组织的OLAP实现(Multidimensional OLAP)。以多维数据组织方式为核心,也就是说,MOLAP使用多维数组存储数据。多维数据在存储中将形成"立方块(Cube)"的结构,在MOLAP中对"立方块"的"旋转"、"切块"、"切片"是产生多维数据报表的主要技术。
HOLAP表示基于混合数据组织的OLAP实现(Hybrid OLAP)。如低层是关系型的,高层是多维矩阵型的。这种方式具有更好的灵活性。
还有其他的一些实现OLAP的方法,如提供一个专用的SQL Server,对某些存储模式(如星型、雪片型)提供对SQL查询的特殊支持。
OLAP工具是针对特定问题的联机数据访问与分析。它通过多维的方式对数据进行分析、查询和报表。维是人们观察数据的特定角度。例如,一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,……,维n,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片(Slice)、切块(Dice)、钻取(Drill-down和Roll-up)、旋转(Pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。
根据综合性数据的组织方式的不同,目前常见的OLAP主要有基于多维数据库的MOLAP及基于关系数据库的ROLAP两种。MOLAP是以多维的方式组织和存储数据,ROLAP则利用现有的关系数据库技术来模拟多维数据。在数据仓库应用中,OLAP应用一般是数据仓库应用的前端工具,同时OLAP工具还可以同数据挖掘工具、统计分析工具配合使用,增强决策分析功能。
|
|
分享到:
相关推荐
联机分析处理(OLAP)是数据分析领域中的关键技术,它主要应用于数据仓库系统,用于支持复杂的决策分析。OLAP的概念由E.F.Codd在1993年提出,旨在弥补传统联机事务处理(OLTP)在数据分析上的不足。Codd为此设定了12条...
### 第三章 联机分析处理OLAP #### OLAP基本思想 联机分析处理(Online Analytical Processing,简称OLAP)是在数据仓库系统中不可或缺的重要数据分析工具。它的核心理念在于通过多维的方式,从不同角度观察和分析...
基于Hadoop的大规模联机分析处理OLAP引擎Kylin Kylin是一款开源的分布式分析引擎,由eBay Inc.开发,提供了SQL接口和多维分析(OLAP)功能,支持极大规模的数据集。Kylin旨在减少Hadoop上的查询延迟,支持10亿以上...
OLAP(联机分析处理)是一种数据仓库技术,用于快速、稳定、一致地访问和分析多维数据,以满足决策支持或多维环境下的特定查询和报表需求。OLAP的概念是由关系数据库之父E.F. Codd在1993年提出的,他认识到联机事务...
在IT领域,多维数据联机分析处理(Online Analytical Processing,简称OLAP)是一种用于数据分析和决策支持的技术。SQL Server 2005作为微软的一款企业级数据库管理系统,提供了强大的OLAP功能,使得用户能够对大量...
- 文件系统存储:例如“联机分析处理-20121105.mmap”可能是使用内存映射文件(Memory-Mapped File)实现的MOLAP系统,这种技术允许直接在内存中访问硬盘上的文件,提高读取速度。 - 数据库支持:如Oracle、IBM ...
第4章 联机分析处理OLAP(共87页).ppt 第5章 数据挖掘关联规则(共143页).ppt 第6章 分类算法基础-决策树(共103页).ppt 第6章 其他分类算法(共76页).ppt 第7章 聚类算法分析(共140页).ppt 第8章 应用案例...
### OLAP(联机分析处理) #### 一、OLAP 的概述 OLAP(联机分析处理)的概念最早由被誉为“关系数据库之父”的E.F.Codd于1993年提出,他在提出这一概念的同时还制定了关于OLAP的12条准则。这一概念的提出在当时...
OLAP,全称为在线分析处理(On-Line Analytical Processing),是一种针对大规模数据进行深度分析的技术。自1993年提出以来,OLAP已成为数据分析领域的重要工具,尤其适用于商业智能(BI)系统,为决策者提供多维度...
数据仓库原理中,OLAP(在线分析处理)技术是数据仓库设计与应用的关键部分,它主要服务于复杂的商业智能和数据分析需求。本章重点讲解了OLAP的概念、特性、实施方法以及多维和关系OLAP的区别。 OLAP技术起源于对...
联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。
数据仓库和联机分析处理(OLAP)是现代企业数据管理和决策支持系统的关键组成部分,它们在数据集成、分析以及提供洞察方面发挥着至关重要的作用。 ### 数据仓库:面向主题的数据集成中心 数据仓库是一个用于存储和...
本实验主要探讨了如何基于Analysis Manager进行联机分析处理(OLAP)操作,通过创建多维数据集来实现对数据的深度分析。 首先,实验中提到了创建多维数据集的过程。在Analysis Manager中,用户需选择“Sample”项目...
OLAP(联机分析处理)是为了解决复杂的决策支持需求而出现的一种技术,它针对特定问题提供了快速、交互式的数据访问和分析能力。在60年代,随着E.F.Codd的关系模型理论的提出,OLTP(联机事务处理)系统得以发展,但...
【目录】 第一部分:OLAP介绍 第二部分: OLAP设计基础知识介绍 第三部分:创建OLAP Services 数据库实例演示 第四部分:数据仓库概念、设计及应用
《联机分析OLAP之Mondrian:深入解析与应用》 OLAP(Online Analytical Processing),即在线分析处理,是数据库技术中的一个重要概念,它主要用于支持决策者的数据分析需求。在OLAP系统中,Mondrian是一个开源的...
数据仓库、联机分析处理(OLAP)以及数据挖掘是信息技术领域中的重要概念,它们在大数据分析和商业智能中扮演着关键角色。 首先,我们来深入理解“数据仓库”。数据仓库是一个集中化的存储系统,用于整合来自不同源...
在第四章中,重点介绍了联机分析处理(OLAP)和数据立方体的概念。 【OLAP(联机分析处理)】OLAP是一种针对大数据进行多维分析的技术,主要服务于决策支持和多维环境下的查询报表需求。其核心在于"维"的概念,包括...
数据仓库与联机分析处理(OLAP)是信息技术领域中用于支持决策支持系统(DSS)的关键组件。数据仓库是一个专门设计用于分析和查询的系统,它与传统的联机事务处理(OLTP)系统有着显著的区别。 联机事务处理(OLTP...
【目的】 如何有效地在高维数据仓库中进行立方计算。 本文提出了一种新方法,该方法计算数据立方体的薄层以及相关的值列表索引。