维度建模的基本概念
维度建模(dimensional modeling)是专门用于分析型数据库、数据仓库、数据集市建模的方法。
它本身属于一种关系建模方法,但和之前在操作型数据库中介绍的关系建模方法相比增加了两个概念:
1. 维度表(dimension)
表示对分析主题所属类型的描述。比如"昨天早上张三在京东花费200元购买了一个皮包"。那么以购买为主题进行分析,可从这段信息中提取三个维度:时间维度(昨天早上),地点维度(京东), 商品维度(皮包)。通常来说维度表信息比较固定,且数据量小。
2. 事实表(fact table)
表示对分析主题的度量。比如上面那个例子中,200元就是事实信息。事实表包含了与各维度表相关联的外码,并通过JOIN方式与维度表关联。事实表的度量通常是数值类型,且记录数会不断增加,表规模迅速增长。
注:在数据仓库中不需要严格遵守规范化设计原则。本文示例中的主码,外码均只表示一种对应关系,此处特别说明。
维度建模的三种模式
1. 星形模式
星形模式(Star Schema)是最常用的维度建模方式,下图展示了使用星形模式进行维度建模的关系结构:
星形模式的维度建模由一个事实表和一组维表成,且具有以下特点:
a. 维表只和事实表关联,维表之间没有关联;
b. 每个维表的主码为单列,且该主码放置在事实表中,作为两边连接的外码;
c. 以事实表为核心,维表围绕核心呈星形分布;
2. 雪花模式
雪花模式(Snowflake Schema)是对星形模式的扩展,每个维表可继续向外连接多个子维表。下图为使用雪花模式进行维度建模的关系结构:
星形模式中的维表相对雪花模式来说要大,而且不满足规范化设计。雪花模型相当于将星形模式的大维表拆分成小维表,满足了规范化设计。然而这种模式在实际应用中很少见,因为这样做会导致开发难度增大,而数据冗余问题在数据仓库里并不严重。
3. 星座模式
星座模式(Fact Constellations Schema)也是星型模式的扩展。基于这种思想就有了星座模式:
前面两种维度建模方法都是多维表对应单事实表,
但在很多时候
维度空间内的
事实表不止一个,而一个维表也可能被多个事实表用到。在业务发展后期,绝大部分维度建模都采用的是星座模式。
三种模式对比
归纳一下,星形模式/雪花模式/星座模式的关系如下图所示:
原文参考:
https://www.cnblogs.com/muchen/p/5310732.html
- 大小: 69.4 KB
- 大小: 98.5 KB
- 大小: 102.1 KB
- 大小: 25.6 KB
分享到:
相关推荐
在众多数据管理方案中,数据仓库与数据集市因其能够支持决策制定而备受关注。虽然这两者在本质上都是用来存储与处理数据的系统,但它们之间存在明显的区别,尤其是在设计理念、架构以及应用场景等方面。接下来,我们...
数据仓库与数据集市.doc
#### 二、数据仓库与数据集市的概念介绍 - **数据仓库**: 是一个用于支持企业各级决策制定过程的数据集合,其主要特点是面向主题、集成性、稳定性和时变性。数据仓库不仅用于存储数据,更重要的是支持复杂的查询和...
"数据仓库与数据集市概念区别" 数据仓库和数据集市是两个常见的概念,在决策支持系统(DSS)中扮演着重要的角色。但是,许多人对这两个概念的理解存在误区,认为它们是相同的系统,或者认为数据仓库是多个数据集市...
### 数据仓库与数据集市体系结构改进 #### 一、数据仓库(DW)的定义与特点 数据仓库(Data Warehouse, DW)是由数据仓库之父W.H. Inmon在其著作《Building the Data Warehouse》中首次明确提出的概念。他指出,数据...
数据仓库与数据集市建模是数据领域中关键的组成部分,主要服务于数据分析和决策支持。建模技术主要包括传统的ER建模和关系建模,以及专为分析设计的维度建模。 维度建模是一种针对数据仓库、数据集市的特殊建模方法...
数据挖掘源代码: 数据仓库与数据挖掘技术浅谈.caj; 数据仓库与数据挖掘12.caj 数据仓库与数据挖掘.caj 数据仓库和数据挖掘技术在ERP中的应用.kdh 数据仓库与数据挖掘1.caj ...数据仓库、数据集市和数据挖掘.caj
数据仓库、数据集市和商业智能(BI)是现代企业数据管理与分析的核心组成部分。这篇文章将深入探讨这些概念,以及它们如何协同工作以支持数据分析。 首先,我们来理解数据仓库。数据仓库是一个集中的、结构化的存储...
### 数据仓库与数据集市 数据集市(Data Marts)是针对特定业务部门或主题的数据仓库子集,通常作为企业级数据仓库的前置或补充,以满足特定部门的分析需求。数据集市可以加快项目实施速度,降低总体成本,但需谨慎...
#### 数据仓库与数据集市的关系及其特点 1. **数据仓库与数据集市的关系** - 数据仓库是所有数据集市的集合体,覆盖了整个企业的数据需求。 - 数据集市通常是针对特定业务领域或部门的数据需求而设立的。 2. **...
2. **数据仓库的体系结构**:常见的数据仓库架构有两层架构、独立型和依赖型数据集市、操作型数据存储(ODS)等。这些架构旨在满足不同规模和复杂度的决策支持需求。 3. **OLAP(在线分析处理)**:是数据仓库中...
数据仓库与数据集市的区别在于其覆盖范围和目标用户。数据仓库覆盖企业级的数据,面向整个组织,而数据集市则专注于特定部门或应用,更加细化和定制化。数据预处理的重要性在数据挖掘中尤为突出,因为它直接关系到...
6. **数据仓库与数据集市**:数据仓库是全面的企业级数据存储,而数据集市是针对特定部门或业务领域的数据存储。自上而下的方法倾向于一开始就构建全面的数据仓库,而自下而上的方法则是先从小规模的数据集市开始,...
**1.5 数据仓库与数据集市(DATA WAREHOUSE与DATA MART)** - **Data Warehouse**:企业级的数据仓库,整合了来自各个业务系统的数据,为企业提供全面的数据视图。 - **Data Mart**:特定主题区域的数据仓库,专注于...
数据仓库、数据集市和数据挖掘.caj 数据仓库的建设与数据挖掘技术浅析.caj 数据仓库和数据挖掘技术在ERP中的应用.kdh 数据仓库与数据挖掘1.caj 数据仓库与数据挖掘12.caj 数据仓库与数据挖掘.caj 数据仓库与数据挖掘...