1)在数据仓库领域有一个概念叫Transaction fact table,中文一般翻译为“事务事实表”。
事务事实表是维度建模的数据仓库中三种基本类型事实表中的一种,另外两种分别是周期快照事实表和累积快照事实表。
事务事实表与周期快照事实表、累积快照事实表使用相同的一致性维度,但是它们在描述业务事实方面是有着非常大的差异的。
事务事实表记录的事务层面的事实,保存的是最原子的数据,也称“原子事实表”。事务事实表中的数据在事务事件发生后产生,数据的粒度通常是每个事务一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。
事务事实表的日期维度记录的是事务发生的日期,它记录的事实是事务活动的内容。用户可以通过事务事实表对事务行为进行特别详细的分析。
通过事务事实表,还可以建立聚集事实表,为用户提供高性能的分析。
2)在数据仓库领域有一个概念叫Periodicsnapshot fact table,中文一般翻译为“周期快照事实表”。
周期快照事实表以具有规律性的、可预见的时间间隔来记录事实,时间间隔如每天、每月、每年等等。典型的例子如销售日快照表、库存日快照表等。
周期快照事实表的粒度是每个时间段一条记录,通常比事务事实表的粒度要粗,是在事务事实表之上建立的聚集表。周期快照事实表的维度个数比事务事实表要少,但是记录的事实要比事务事实表多。
周期快照事实表的日期维度通常是记录时间段的终止日,记录的事实是这个时间段内一些聚集事实值。事实表的数据一旦插入即不能更改,其更新方式为增量更新。
3)在数据仓库领域有一个概念叫Accumulatingsnapshot fact table,中文一般翻译为“累积快照事实表”。
累积快照事实表和周期快照事实表有些相似之处,它们存储的都是事务数据的快照信息。但是它们之间也有着很大的不同,周期快照事实表记录的确定的周期的数据,而累积快照事实表记录的不确定的周期的数据。
累积快照事实表代表的是完全覆盖一个事务或产品的生命周期的时间跨度,它通常具有多个日期字段,用来记录整个生命周期中的关键时间点。另外,它还会有一个用于指示最后更新日期的附加日期字段。由于事实表中许多日期在首次加载时是不知道的,所以必须使用代理关键字来处理未定义的日期,而且这类事实表在数据加载完后,是可以对它进行更新的,来补充随后知道的日期信息。
举例来说,
订货日期
预定交货日期
实际发货日期
实际交货日期
数量
金额
运费
区别比较:
根据Kimball的数据仓库理论,事实表分为三种类型:交易事实表、周期快照事实表和累积快照事实表。以下是这几种事实表之间的区别。
特点 |
交易事实 |
周期快照事实 |
累积快照事实 |
时间/时期 |
时间 |
时期 |
时间跨度较短的多个时点 |
粒度 |
每行代表一个交易事件 |
每行代表一个时间周期 |
每行代表一个业务周期 |
事实表加载 |
新增 |
新增 |
新增和修改 |
事实表更新 |
不更新 |
不更新 |
新事件产生时更新 |
时间维 |
业务日期 |
时期末 |
多个业务过程的完成日期 |
事实 |
交易活动 |
时间周期内的绩效 |
限定多个业务阶段内的绩效 |
相关推荐
本文档《数据仓库知识体系》详细整理了数据仓库领域几乎所有的知识点,覆盖了数据仓库的多个方面,从发展阶段、数据模型、事实表设计、多维体系结构、规范设计、元数据管理、维度表设计、范式和反范式化、数据仓库...
### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...
- **数据仓库的建立**: 主要涉及数据集成、维表建立等方面。数据集成是为了确保数据的一致性和完整性,而维表则是用来描述事实表中的数据维度。 #### 四、OLAP操作 - **OLAP(在线分析处理)**: OLAP技术用于支持...
数据仓库与数据挖掘是信息技术领域中的重要组成部分,尤其在大数据时代,它们的作用愈发显著。这份《数据仓库与数据挖掘》课程设计方案报告模板旨在为学生提供一个实践导向的学习框架,通过实际项目来理解并掌握这两...
粒度决定了数据仓库中的事实表和维度表的设计。 通过这些步骤,Oracle数据仓库设计指南提供了一套完整的、系统化的设计方法,帮助开发者和数据架构师构建高效、灵活且适应业务变化的数据仓库。无论是对于初学者还是...
通过对通信公司的业务需求进行深入分析,构建了一个包含多个维度和事实表的数据仓库,从而实现了对公司运营情况的有效监控和分析。 **4.2 案例2:大唐电信ODS数据整合案例** 这个案例介绍了大唐电信如何利用操作型...
在课程中,可能涵盖了数据仓库的设计原则,如星型、雪花型和星座模型,以及如何构建维度和事实表。此外,可能会讨论数据清洗和数据集成的重要性,以确保数据质量。 接着,我们来看知识发现,这是数据挖掘的一个主要...
5. **维度模型**:维度模型是数据仓库建模的常用方法,以业务概念(如时间、地点、产品等)为维度,事实表记录业务事件。 6. **维度建模要求**:维度模型要求包含原子数据、一致性维度和事实,遵循数据仓库总线架构...
数据仓库与数据挖掘是现代信息技术领域中的重要组成部分,它们在商业智能、决策支持以及洞察力发现等方面发挥着关键作用。让我们深入探讨这两个概念及其在实际应用中的相关知识点。 首先,我们来了解数据仓库的基本...
维度是数据仓库中用于描述事实数据的结构性特征,它提供了对数据的分类和层级结构,使得用户能够基于这些分类进行数据分析。维度通常基于源系统中的表格创建,通过精心选择的列来定义维度的属性。维度的层次结构反映...
数据仓库是信息技术领域中的一个重要概念,它是一种特殊设计的数据库系统,主要目的是...理解其概念和体系结构对于构建有效的数据仓库系统至关重要,同时,关联规则和数据分类等技术则能进一步提升数据的价值和洞察力。
### 数据挖掘与数据仓库在超市销售中的应用 #### 一、需求分析与数据理解 **需求分析** 在超市的一般销售当中,不同的商品之间可能存在某些潜在的联系。例如,在传统零售业中,经常被提及的一个经典案例是“啤酒...
5. **星型/雪花型模式**:常见的数据仓库模型,其中事实表和维度表构成星型或雪花型结构,简化查询和分析。 Immon的第四版可能会进一步讨论数据仓库的最新发展,如云数据仓库、实时数据仓库以及大数据环境下的数据...
在数据仓库中,某些维度数据随时间缓慢变化,如客户地址或产品分类。正确处理这些缓慢变化维度是数据仓库设计的关键,确保历史数据的准确性和查询性能。 ### 数据仓库与数据集市 数据集市(Data Marts)是针对特定...
#### 一、数据仓库的概念与分类 **1.1 数据的两种形式:操作数据与分析数据** - **操作数据**:主要用于支持日常业务操作,如交易处理、订单录入等。这类数据通常存储在联机事务处理(OLTP)系统中,特点是实时性...
数据仓库的构建方法包括星型模式和雪花模式,这两种模式都采用维度表和事实表来存储数据,其中星型模式比雪花模式更为简单,易于理解和实施。 OLAP(联机分析处理)是数据仓库中一种用于多维度数据分析的技术,它...
### 基于数据仓库Web日志的数据挖掘实例解析 #### 一、引言 随着互联网的普及和发展,大量的用户行为数据被记录下来,成为宝贵的商业资源。如何有效地利用这些数据,提取有价值的信息,成为了现代商业竞争的关键之...
随着企业的不断发展,数据仓库中的事实表记录数量会不断增加,而维度表不仅需要增加新的记录,有时还需要更新已有的数据。因此,理解和掌握维度表的更新技术对于维护数据仓库的有效性和准确性至关重要。 #### 二、...