`
心动音符
  • 浏览: 336857 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

星型模型 和 雪花模型

 
阅读更多

星形模式是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimension Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称为事实(Fact),它们一般都是数值或其他可以进行计算的数据;而维大都是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不同的维(事实表主键的部分或全部)来对这些事实数据进行求和(summary)、求平均(average)、计数(count)、百分比(percent)的聚集计算,甚至可以做20~80分析。这样就可以从不同的角度数字来分析业务主题的情况。

 

在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。

 

当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型。

星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,如在地域维度表中,存在国家 A 省 B 的城市 C 以及国家 A 省 B 的城市 D 两条记录,那么国家 A 和省 B 的信息分别存储了两次,即存在冗余。

当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 " 层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。如图 2-3,将地域维表又分解为国家,省份,城市等维表。它的优点是 : 通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。

星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高。星型结构不用考虑很多正规化的因素,设计与实现都比较简单。 雪花型模型由于去除了冗余,有些统计就需要通过表的联接才能产生,所以效率不一定有星型模型高。正规化也是一种比较复杂的过程,相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。

分享到:
评论

相关推荐

    数据仓库架构星型模型VS雪花模型.docx

    数据仓库架构中,星型模型和雪花模型是两种常见的维度建模方法,它们在处理大量数据和提供商业智能(BI)解决方案时起着至关重要的作用。这两种模型在设计原理、数据冗余、查询效率和规范性方面都有所不同。 首先,...

    数据仓库架构星型模型VS雪花模型.pdf

    数据仓库架构中的星型模型和雪花模型是两种常见的多维数据模型,主要用于支持商业智能(BI)和数据分析。这两种模型都是基于维度表和事实表的概念,但它们在数据规范化程度、冗余数据处理和查询效率方面有所不同。 ...

    星型雪花模型多维数据建模

    星型模式、雪花模型多维数据建模分析,包含不同的数据建模方法

    星级酒店数据集市雪花模型的设计与应用.docx

    通过对星型模型和雪花模型特点的分析,结合星级酒店的具体业务需求,详细介绍了雪花模型在星级酒店数据集市中的应用。 #### 关键词 星级酒店;数据集市;雪花模型 #### 1. 星级酒店经营数据集市的“星型模型” ...

    简单介绍模型概念.docx

    常见的两种模型是星型模型和雪花模型。星型模型由一个事实表和一组维表组成,事实表包含度量信息,维表提供维度数据,连接关系直观,易于查询,但可能引入冗余。雪花模型是对星型模型的规范化,减少了冗余,但增加了...

    企业大数据平台下数据仓库架构(阿里云栖花积分买的)

    本文将深入探讨企业大数据平台下的数据仓库架构,重点关注其中的星型模型与雪花模型,并结合具体实践案例,为企业提供一套完整的数据仓库设计方案。 #### 二、数据仓库模型:星型模型与雪花模型 ##### 1. 星型模型...

    QlikView Data Model(数据模型)

    传统的数据模型通常包括两种主要类型:星型模型和雪花模型。 ###### 2.1.1 星型模型 星型模型是最常用的数据仓库设计之一。在这种模型中,所有的维度表都直接连接到一个中心的事实表上,形成了类似于星星的形状。...

    mondrian3.5

    Mondrian是一个开放源代码的Rolap服务器,使用java开发的。它实现了xmla和jolap规范,而且自定义了一种使用mdx语言的客户端接口。...在功能上,Mondrian支持共享维和成员计算,支持星型模型和雪花模型的功能。

    数据仓库开发模型PPT学习教案.pptx

    雪花模型是星型模型的扩展,维度表经过规范化处理,形成更复杂的层次结构。 2.3 数据仓库逻辑模型: 逻辑模型关注数据仓库的内部结构,包括事实表和维度表的设计。事实表存储关键的业务指标,维度表提供描述性信息...

    大数据技术 数据仓库原理设计与应用 第1、2章 数据仓库开发模型(共30页).ppt

    雪花模型则是星型模型的扩展,维度表进一步规范化,形成了更复杂的层级结构,虽然增加了数据冗余,但保持了数据的一致性。 逻辑模型设计时,事实表是数据仓库的核心,包含了关键业务指标和外键。维度表则提供了描述...

    第2章 数据仓库开发模型.pptx

    雪花模型则是星型模型的扩展,其维度表经过进一步规范化,形成多层结构,提高了数据的一致性,但可能增加查询复杂性。 2.3 数据仓库逻辑模型 逻辑模型细化了概念模型,定义了数据的精确结构。例如,客户事实表包含...

    第2章数据仓库开发模型.pptx

    雪花模型则是在星型模型基础上对维度表进行规范化,提供更细粒度的数据,但可能增加查询复杂性。 数据仓库逻辑模型设计时,事实表是核心,包含了关键业务指标,如客户交易额、交易量等。维表则描述了这些事实的上...

    数据仓库原理 数据仓库设计与应用 第2章 数据仓库开发模型(共30页).ppt

    星型模型和雪花模型是数据仓库设计中常见的两种逻辑模型。星型模型以事实表为核心,周围环绕着多个维度表,提供直观的分析路径。雪花模型则是对星型模型的规范化扩展,每个维度可以进一步分解为更详细的子维度表,...

    基于ER模型的多维建模

    **多维模型**,如星型模型和雪花模型,是数据仓库常用的模型。它们将数据组织成立方体形式,由事实表和维表构成。事实表包含可度量的业务数据,如交易金额,而维表则存储描述性的维度信息,如时间、地点、产品等。...

    星级酒店经营数据集市的“星型模型”

    为了克服星型模型的一些局限性,星级酒店经营数据集市还可以采用**雪花模型**的设计思路,进一步细化维度表。例如: - **客户维**的雪花化:区分不同类型的客户,提高服务针对性。 - **消费项目维**的雪花化:按照...

    大数据分析与大数据挖掘课程 数据仓库与数据挖掘教程 第3章 数据存储 共56页.pptx

    逻辑模型则关注如何在数据仓库中实现这些概念,以支持决策过程,如星型模型和雪花模型。星型模型具有较高的可读性和快速查询速度,但冗余度高;而雪花模型通过规范化减少了数据冗余,但可能牺牲了一些性能。 接着,...

    销售案例数仓+spark项目答案版.zip

    2. **星型模型和雪花模型**:在数仓设计中,常见的数据模型有星型模型和雪花模型。星型模型由事实表和一组维度表组成,结构简单,查询效率高,适合快速查询。雪花模型是在星型模型基础上对维度表进行了规范化,减少...

    基于大数据的数据仓库-数据仓库建模基本理论.pdf

    星型模型简化了维度表设计,牺牲部分存储空间以提高查询效率,而雪花模型则通过规范化维度表降低冗余,但可能导致查询时需要连接更多表,影响性能。 在选择建模方法时,需要权衡性能、成本、易用性和数据质量。对于...

    数据仓库报告.docx

    在存储模型方面,数据仓库摒弃了传统的数据库关系模式,转而采用更适合分析查询的模型,如星型模型和雪花模型。星型模型由一个中心事实表和多个维表组成,事实表存储业务交易的事实数据,而维表则包含描述性信息,...

Global site tag (gtag.js) - Google Analytics