在数据仓库领域有一个概念叫Transaction fact table,中文一般翻译为“事务事实表”。事务事实表是维度建模的数据仓库中三种基本类型事实表中的一种,另外两种分别是周期快照事实表和累积快照事实表。
事务事实表与周期快照事实表、累积快照事实表使用相同的一致性维度,但是它们在描述业务事实方面是有着非常大的差异的。
事务事实表记录的事务层面的事实,保存的是最原子的数据,也称“原子事实表”。事务事实表中的数据在事务事件发生后产生,数据的粒度通常是每个事务一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。
事务事实表的日期维度记录的是事务发生的日期,它记录的事实是事务活动的内容。用户可以通过事务事实表对事务行为进行特别详细的分析。
通过事务事实表,还可以建立聚集事实表,为用户提供高性能的分析。
2) 在数据仓库领域有一个概念叫Periodic snapshot fact table,中文一般翻译为“周期快照事实表”。
周期快照事实表以具有规律性的、可预见的时间间隔来记录事实,时间间隔如每天、每月、每年等等。典型的例子如销售日快照表、库存日快照表等。
周期快照事实表的粒度是每个时间段一条记录,通常比事务事实表的粒度要粗,是在事务事实表之上建立的聚集表。周期快照事实表的维度个数比事务事实表要少,但是记录的事实要比事务事实表多。
周期快照事实表的日期维度通常是记录时间段的终止日,记录的事实是这个时间段内一些聚集事实值。事实表的数据一旦插入即不能更改,其更新方式为增量更新。
3)在数据仓库领域有一个概念叫Accumulating snapshot fact table,中文一般翻译为“累积快照事实表”。
累积快照事实表和周期快照事实表有些相似之处,它们存储的都是事务数据的快照信息。但是它们之间也有着很大的不同,周期快照事实表记录的确定的周期的数据,而累积快照事实表记录的不确定的周期的数据。
累积快照事实表代表的是完全覆盖一个事务或产品的生命周期的时间跨度,它通常具有多个日期字段,用来记录整个生命周期中的关键时间点。另外,它还会有一个用于指示最后更新日期的附加日期字段。由于事实表中许多日期在首次加载时是不知道的,所以必须使用代理关键字来处理未定义的日期,而且这类事实表在数据加载完后,是可以对它进行更新的,来补充随后知道的日期信息。
举例来说,
订货日期
预定交货日期
实际发货日期
实际交货日期
数量
金额
运费
在这个累积快照事实表中,记录的是购买货物的整个生命周期的数据,记录第一次产生时,实际发货日期和实际交货日期是不确定的,需要用表示未知的代理关键字来代替。等实际发货后,需要对数据仓库中的这条记录进行更新操作,将实际发货日期补上。
分享到:
相关推荐
目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其 著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse) 是一个面向主题的(Subject Oriented)、集成的...
数据仓库体系全套模板,共6份,包括命名规范、事实表梳理、维度梳理、业务梳理及标体系梳理等。 模板-命名规范 模板-事实表梳理 模板-维度梳理 模板-业务梳理 模板-指标体系梳理 模板-数据仓库整体设计方案
本文档《数据仓库知识体系》详细整理了数据仓库领域几乎所有的知识点,覆盖了数据仓库的多个方面,从发展阶段、数据模型、事实表设计、多维体系结构、规范设计、元数据管理、维度表设计、范式和反范式化、数据仓库...
星型模型是一种常见的逻辑模型,有一个事实表,且事实表中的属性由指向各个维表的外键和一些相应的度量数据组成。雪花模型通过在每个维表基础上,增加附加维表的方式来降低星型模型中可能会存在的冗余现象。事实星座...
根据提供的信息,我们可以总结出以下关于《数据仓库工具箱》第三版的重要知识点: ### 一、书籍基本信息 - **书名**:《数据仓库工具箱》第三版(The Data Warehouse Toolkit Third Edition) - **作者**:Ralph ...
数据仓库中的代理键(Surrogate Key)是一种在维度表中使用的特殊主键,它通常是一个自动递增的整数,不具有业务含义,主要用于解决维度数据变化时的维护问题。在传统的数据库设计中,主键通常是业务上的唯一标识,...
Inmon在数据仓库的架构设计中提出了“星形模式”(Star Schema)和“雪花模式”(Snowflake Schema),这两种模式成为了数据仓库设计的标准化方法。星形模式包括一个中心表(事实表)和一组与之相关的维表(维度表)...
### 数据仓库工具箱 第三版 #### 知识点概览 1. **维度建模的概念与重要性** 2. **维度模型设计方法** 3. **事实表与维度表的设计原则** 4. **数据仓库架构的最佳实践** 5. **ETL(Extract, Transform, Load)流程...
它定义了数据仓库的层次结构,包括事实表和维度表的设计,以及如何组织和分层数据以支持业务分析。此外,规划说明书还可能涉及技术选型、硬件和软件需求、性能优化等方面。 **数据仓库管理程序设计说明书**是关于...
按照事实表中度量的可加性情况,可以把事实表对应的事实分为 4 种类型:事务事实、快照事实、线性项目事实和事件事实。确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据拥护需求设计聚合模型。 ...
数据仓库是一种特殊设计的数据库系统,用于支持企业的决策分析过程,它从多个源系统中集成大量历史数据,提供快速查询和复杂分析的能力。本实验报告主要涵盖了数据仓库的需求分析、模型设计以及在SQL Server ...
通过维度建模,数据仓库中的数据被组织为事实表和维度表。事实表用于存储业务事件的度量值,如销售量或销售额;维度表则用来存储关于事实表中事件的上下文信息,如时间、地点、产品和客户等。这种结构不仅便于用户...
### Oracle 数据仓库中的三种优化策略 #### 一、分区优化 **分区**(Partitioning)是Oracle数据仓库中一种重要的优化手段,它通过将大型表或索引分解成更小、更易于管理的部分来提高查询性能。分区技术尤其适用于...
6. **粒度**:定义了数据仓库中的事实表记录的详细程度,决定了数据的存储和查询效率。 7. **缓慢变化维度**:处理随着时间变化但不应立即删除的历史数据,例如,客户的地址或价格变动。 8. **数据清洗**:在加载...
#### 三、数据仓库的设计与建立 - **概念模型设计**: 概念模型设计是整个数据仓库设计的基础,主要包括星型模型和雪花型模型的设计。这些模型可以帮助理解数据之间的关系,并为后续的数据仓库建立提供框架。 - **...
数据仓库通常采用星型或雪花型架构,这两种模式都以事实表为中心,周围环绕着多个维度表。事实表包含度量值,是分析的主要对象;维度表提供描述性信息,帮助用户理解和上下文化度量值。星型架构简单直观,性能优秀,...
数据仓库的物理数据模型通常包括维度表、事实表等,ETL解决方案的实施需要这些模型中各个表的相互作用。理解如何使维度、事实以及其他维度模型中的表协同工作,是成功实施ETL解决方案的关键。 ### 数据流过程检查与...
报告中的“销售数据OLAP分析”部分,任务是设计星型架构的多维数据集,这是一种简化了查询复杂性的数据模型,中心事实表(如Sales)周围环绕着多个维度表。数据集处理涉及数据聚合和预计算,以提高查询效率。OLAP...
* 非易失的:数据仓库中的数据是非易失的,意味着数据一旦存储,就不会被删除或修改。 * 随时间变化的:数据仓库中的数据是随时间变化的,意味着数据会随着时间的推移而改变。 数据仓库的结构 数据仓库的结构可以...