在Kimball的维度建模的数据仓库中,关于多维体系结构(MD)有三个关键性概念:总线架构(Bus Architecture),一致性维度(Conformed Dimension)和一致性事实(Conformed Fact)。
多维体系结构(总线架构)
数据仓库领域里,有一种构建数据仓库的架构,叫Multidimensional Architecture(MD),中文一般翻译为“多维体系结构”,也称为“总线架构”(Bus Architecture)。多维体系结构的创始人是数据仓库领域中最有实践经验的Kimball博士。
多维体系结构主要包括后台(Back Room)和前台(Front Room)两部分。后台也称为数据准备区(Staging Area),是MD架构的最为核心的部件。在后台,是一致性维度的产生、保存和分发的场所。同时,代理键也在后台产生。
前台是MD架构对外的接口,包括两种主要的数据集市,一种是原子数据集市,另一种是聚集数据集市。原子数据集市保存着最低粒度的细节数据,数据以星型结构来进行数据存储。聚集数据集市的粒度通常比原子数据集市要高,和原子数据集市一样,聚集数据集市也是以星型结构来进行数据存储。前台还包括像查询管理、活动监控等为了提供数据仓库的性能和质量的服务。
在多维体系结构中,所有的这些基于星型机构来建立的数据集市可以在物理上存在于一个数据库实例中,也可以分散在不同的机器上,而所有这些数据集市的集合组成的分布式的数据仓库。
一致性维度
在多维体系结构中,没有物理上的数据仓库,由物理上的数据集市组合成逻辑上的数据仓库。而且数据集市的建立是可以逐步完成的,最终组合在一起,成为一个数据仓库。如果分步建立数据集市的过程出现了问题,数据集市就会变成孤立的集市,不能组合成数据仓库,而一致性维度的提出正式为了解决这个问题。
一致性维度的范围是总线架构中的维度,即可能会在多个数据集市中都存在的维度,这个范围的选取需要架构师来决定。一致性维度的内容和普通维度并没有本质上区别,都是经过数据清洗和整合后的结果。
一致性维度建立的地点是多维体系结构的后台(Back
Room),即数据准备区。在多维体系结构的数据仓库项目组内需要有专门的维度设计师,他的职责就是建立维度和维护维度的一致性。在后台建立好的维度同步复制到各个数据集市。这样所有数据集市的这部分维度都是完全相同的。建立新的数据集市时,需要在后台进行一致性维度处理,根据情况来决定是否新增和修改一致性维度,然后同步复制到各个数据集市。这是不同数据集市维度保持一致的要点。
在同一个集市内,一致性维度的意思是两个维度如果有关系,要么就是完全一样的,要么就是一个维度在数学意义上是另一个维度的子集。例如,如果建立月维度话,月维度的各种描述必须与日期维度中的完全一致,最常用的做法就是在日期维度上建立视图生成月维度。这样月维度就可以是日期维度的子集,在后续钻取等操作时可以保持一致。如果维度表中的数据量较大,出于效率的考虑,应该建立物化视图或者实际的物理表。
这样,维度保持一致后,事实就可以保存在各个数据集市中。虽然在物理上是独立的,但在逻辑上由一致性维度使所有的数据集市是联系在一起,随时可以进行交叉探察等操作,也就组成了数据仓库。
一致性事实
在建立多个数据集市时,完成一致性维度的工作就已经完成了一致性的80%-90%的工作量。余下的工作就是建立一致性事实。
一致性事实和一致性维度有些不同,一致性维度是由专人维护在后台(Back Room),发生修改时同步复制到每个数据集市,而事实表一般不会在多个数据集市间复制。需要查询多个数据集市中的事实时,一般通过交叉探查(drill across)来实现。
为了能在多个数据集市间进行交叉探查,一致性事实主要需要保证两点。第一个是KPI的定义及计算方法要一致,第二个是事实的单位要一致性。如果业务要求或事实上就不能保持一致的话,建议不同单位的事实分开建立字段保存。
这样,一致性维度将多个数据集市结合在一起,一致性事实保证不同数据集市间的事实数据可以交叉探查,一个分布式的数据仓库就建成了。
分享到:
相关推荐
浅析多维体系结构(总线架构),一致性维度和一致性事实 多维体系结构(MD)是数据仓库领域中的一种架构,由Kimball博士所创始。MD架构主要包括后台(Back Room)和前台(Front Room)两部分。后台也称为数据准备区...
总结来说,多维体系结构(总线架构)是一种强大的数据仓库设计方案,通过后台与前台的分工合作,以及一致性维度和一致性事实的管理,实现了数据的高效集成、一致性和可分析性。它对于大型企业处理复杂数据环境和满足...
多维体系结构(Multidimensional Architecture,MD)是一种在数据仓库设计中广泛采用...通过这种方式,多维体系结构(总线架构)能够提供一个灵活、可扩展且高度一致的数据环境,以支持复杂的商业智能需求和决策支持。
浅析Struts 体系结构与工作原理.doc
### 模型驱动体系结构(MDA)浅析 #### 一、引言与背景 在软件工程领域,随着企业应用复杂度的不断提高以及技术标准的多样化,如何有效地管理和集成这些复杂的系统成为了一项重大挑战。为了应对这一挑战,国际对象...
在金融领域,特别是银行行业,分布式架构能够提供更高的性能、可扩展性和可靠性。 对公存款账户体系是指银行针对企业及其他非个人客户的存款账户系统。这些账户不仅记录资金的流动,也是银行获取稳定资金来源的重要...
计算机硬件体系架构浅析 CPU 内存 HDD/SSD 网卡 RAID卡 虚拟化
在当前快速发展的信息技术时代,计算机体系结构模拟技术的重要性日益凸显,它为新架构的设计验证、软件的性能预测以及硬件与软件协同优化提供了强有力的支持工具。 一、计算机体系结构模拟技术现状 1. 高级指令集...
未来计算机体系结构模拟技术的发展方向包括:提高模拟速度和模拟精度、开发新的模拟技术、提高模拟技术在实际应用中的可靠性和可扩展性等。计算机体系结构模拟技术的发展对计算机系统的研究和设计开发有着重要的影响...
Oracle体系架构浅析 数据库调优培训
本文将主要讨论非结构化网格的适应性和多维性这两个优点。 首先,非结构化网格对于不规则计算区域的适应性意味着它能够有效地模拟真实物理问题中的复杂几何形状。这种网格由不规则的多边形或多面体元素构成,这些...
XML架构可以用来定义SOAP消息的结构,确保消息的有效性和一致性。此外,XML架构还可以与WS-I(Web Services Interoperability Organization)的指导原则一起使用,以促进不同平台和编程语言之间的互操作性。 #### ...
本文将对 ORACLE 数据库的体系结构和安全性策略进行浅析,以帮助读者更好地理解 ORACLE 数据库的工作原理和安全机制。 一、ORACLE 数据库体系结构 ORACLE 数据库是一个关系型数据库管理系统,由多个组件组成。一个...
企业信息化体系结构是现代企业发展的重要组成部分,它涵盖了企业运营中的数据管理、系统集成、业务流程优化等多个方面。本文将深入探讨企业信息化体系结构的核心概念、关键要素以及实施策略,旨在帮助企业构建高效、...
浅析企业信息化体系结构.pptx
双核心CPU缓存数据一致性浅析 本文主要讨论双核心CPU缓存数据一致性问题。随着双核心CPU的出现,缓存数据一致性问题变得越来越重要。双核心CPU的设计主要有两种:独立缓存设计和共享缓存设计。独立缓存设计是指每个...
本文将浅析海上智能交通系统架构,讨论其组成部分、功能和应用。 一、海上智能交通系统架构 海上智能交通系统架构主要包括智能交通组织、动态监管、船舶计划动态、智能排序与分发等功能模块。这些模块通过智能技术...
**SOA三层体系结构概述** 服务导向架构(Service-Oriented Architecture, SOA)是一种设计原则,用于构建松散耦合、模块化的软件系统。它允许不同系统之间的服务进行交互和共享,从而促进业务流程的集成和灵活性。...
CAN总线网络拓扑结构设计...本文对基于CAN总线的网络拓扑结构设计进行了浅析,讨论了设计网络拓扑结构的相关因素和方法,并对节点分类和网络负载率计算进行了详细阐述。希望本文能够为车载网络开发提供有价值的参考。