星形模型(Star Schema)和雪花模型(Snowflake Schema)是数据仓库中常用到的两种方式,而它们之间的对比要从四个角度来进行讨论。
1.数据优化
雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,因此它能够有效地减少数据量。通过引用完整性,其业务层级和维度都将存储在数据模型之中。
▲图1 雪花模型
相比较而言,星形模型实用的是反规范化数据。在星形模型中,维度直接指的是事实表,业务层级不会通过维度之间的参照完整性来部署。
▲图2 星形模型
2.业务模型
主键是一个单独的唯一键(数据属性),为特殊数据所选择。在上面的例子中,Advertiser_ID就将是一个主键。外键(参考属性)仅仅是一个表中
的字段,用来匹配其他维度表中的主键。在我们所引用的例子中,Advertiser_ID将是Account_dimension的一个外键。
在雪花模型中,数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。而在星形模型中,所有必要的维度表在事实表中都只拥有外键。
3.性能
第三个区别在于性能的不同。雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。举个例子,如果你想要知道Advertiser
的详细信息,雪花模型就会请求许多信息,比如Advertiser Name、ID以及那些广告主和客户表的地址需要连接起来,然后再与事实表连接。
而星形模型的连接就少的多,在这个模型中,如果你需要上述信息,你只要将Advertiser的维度表和事实表连接即可。
4.ETL
雪花模型加载数据集市,因此ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。
星形模型加载维度表,不需要再维度之间添加附属模型,因此ETL就相对简单,而且可以实现高度的并行化。
总结
雪花模型使得维度分析更加容易,比如“针对特定的广告主,有哪些客户或者公司是在线的?”星形模型用来做指标分析更适合,比如“给定的一个客户他们的收入是多少?”
原文链接:http://www.searchbi.com.cn/showcontent.aspx?aid=64436
分享到:
相关推荐
数据仓库架构中,星型模型和雪花模型是两种常见的维度建模方法,它们在处理大量数据和提供商业智能(BI)解决方案时起着至关重要的作用。这两种模型在设计原理、数据冗余、查询效率和规范性方面都有所不同。 首先,...
数据仓库架构中的星型模型和雪花模型是两种常见的多维数据模型,主要用于支持商业智能(BI)和数据分析。这两种模型都是基于维度表和事实表的概念,但它们在数据规范化程度、冗余数据处理和查询效率方面有所不同。 ...
本文将深入探讨数据仓库的两种常见架构——星形架构和雪花形架构,以及它们之间的差异和适用场景。 #### 二、星形架构 星形架构是最为常见的数据仓库设计模式之一,它基于一个事实表和多个维度表构建而成。在这个...
数据仓库的设计通常涉及星型模式、雪花模式等多种架构设计方法,用于优化数据的查询性能、简化数据的组织结构。 在数据仓库模型设计过程中,需要考虑到数据的整合和转换规则、数据的粒度水平、数据仓库的维度模型...
星型模式、雪花模型多维数据建模分析,包含不同的数据建模方法
在当今的企业运营环境中,数据仓库模型的建立是帮助企业管理其财务数据,从而进行深入分析并制定策略的关键。对于企业而言,理解并构建基于财务数据分析的数据仓库模型是一项至关重要的工作。接下来,我们将详细介绍...
【DW2.0 下一代数据仓库架构】 数据仓库(Data Warehouse)是一种专为数据分析而设计的系统,它从各种操作型数据库中收集、整合数据,为业务决策提供支持。随着大数据时代的到来,传统的数据仓库已经无法满足处理...
数据仓库设计模式有两种:雪花模型和星型模型。雪花模型是一种层次结构,维度表按照三范式设计,优点是结构清晰、维护方便,但性能较差。星型模型是一种平面结构,维度表直接与事实表关联,优点是性能高、查询速度快...
本主题将深入探讨“数据仓库建模之金融银行模型篇”,旨在为读者提供一个全面理解金融银行业数据仓库建模的框架结构。 首先,我们要明白数据仓库的基本概念。数据仓库是一个集中的、非易失性的、用于报告和分析的...
数据仓库常常采用多维数据模型,其中最常见的是星型或雪花型模式。立方体是多维数据模型的一种表现形式,它以维度和度量为核心概念。 - **维度**:代表观察数据的角度,如时间、地理位置、产品类别等。维度可以有多...
常见的数据仓库架构方式主要包括星形架构和雪花形架构,这两种方式都基于关系数据库模型,并且以多维数据模型为核心。 1. 星形架构 星形架构是数据仓库中最直观和最常用的模型,它以事实表为中心,周围环绕着多个...
2. 维度模型:一种用于数据分析和报表的数据模型,包括星型模型和雪花模型。 数据集市 数据集市是一个基于数据仓库的数据分析平台,提供了一个统一的数据访问入口,满足当前及可预期的分析需求。数据集市的主要...
- **多维数据模型**:构建基于时间和地点等维度的数据模型,例如星形模型和雪花模型,以便于进行多角度分析。 - **关系型数据库**:用于存储细节数据和聚合数据,支持结构化的数据查询。 - **非关系型数据库**:例如...
数据仓库和数据湖是两种不同数据管理策略的代表,它们反映了数据架构的演进历程。数据仓库自20世纪70年代随着关系数据库的发展而兴起,主要目标是为决策支持提供结构化的、一致的和历史的数据。数据仓库通过ETL...
1. **数据仓库的概念与模型**:介绍数据仓库的基本概念,如多维模型(星型、雪花型、星座型),以及数据仓库的不同架构(层次型、关系型、MOLAP、ROLAP、HOLAP)。 2. **数据仓库的生命周期**:包括需求分析、数据...