数据仓库的建立是为了某群体提供决策服务的,属于决策支持系统(Decision Support System)。
数据仓库必须满足: 1.只读的(Read Only); 2.历史的(Historical); 3. 聚合的(Aggregated);
实际中数据流动: 数据经由分段数据库到逻辑数据库最后才到数据库仓库。
Staging Layer -> Enterprise Layer -> Presentation Layer
对于需要高响应应付从不同地方,不同系统,不同要求的数据,一般情况下会立即存储在分段数据库(Staging Layer),之后在做处理,这里起到一个临时表的作用。
经过系统的处理(process),数据会存储于对应的逻辑数据库中。例如每一个时间段的银行的交易量都是非常大的,数据会先存在Staging,然后经过处理后存储进关系型数据库Enterprise,一般Enterprise数据库都符合第三范式。
数据仓库绝大部分都是归档数据(Archive Data),很多业务流程往往不是第一时间进入数据库仓库,从而在到达数据仓库前会有一层业务数据库Enterprise Layer,所以Presentation与Enterprise是由代替键(Surrogate Key)与业务逻辑键(Natural Key)建立起联系,并且关系储存于Dimension。
星型数据库的组成: 1.事实(Fact table); 2.维(Dimension table); 一套星型数据结构,应该只有一个Fact,和多个Dimension,而每个dimension之间是没有任何联系的。
Fact的粒度应该是达到度量的最低层,例如每个货物的单价。而维度则是为划分的界限,例如想看到货物在某个时间段的价格,那么时间段就是一个维度。
因为有关系型数据库转换为星型数据库,所以某些表必然会存在冗余数据,而这正是建立的Fact与Dimension的要素。
关系图
原创文章若有转载,务请注明出处:http://www.sightcorner.com/technique/2013_06_10
相关推荐
星型数据库(Star Schema Database)是一种特殊的数据库设计方法,它是OLAP系统的一种实现方式。星型数据库的特点是将数据分成事实表(Fact Table)和维度表(Dimension Table)。事实表存储了具体的数据,而维度表...
该基准测试的目的是为了回答一个重要问题:如何将非星型模式的数据库模式转换为星型模式而不会丢失重要的查询信息。 #### 发展背景与目的 SSB 由 Pat O'Neil、Betty O'Neil 和 Xuedong Chen 于 2007 年 1 月提出,...
STAR SCHEMA是一种常用的数据库设计模型,主要包括两种类型的表: - **Fact Table**:事实表,包含大量业务数据,是整个星型模型的核心。 - **Dimension Table**:维度表,用于描述事实表中的数据,如时间、地点等。...
在数据库设计中,尤其是星型模式(Star Schema)中,存在两种类型的表:事实表(Fact Tables)和维度表(Dimension Tables)。事实表通常包含大量的测量值或度量标准,而维度表则包含了描述事实表中记录的维度属性...
技能包括:使用PostgreSQL创建关系数据库使用事实和维度表的优化定义开发星型数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 经验包括:Python,PostgreSql,Star Schema,ETL管道,规范...
9. **STAR SCHEMA中的表**:事实表(Fact Table)存储度量值,维度表(Dimension Table)存储描述性信息。 10. **在FACT Table上创建索引**:通常使用位图索引以优化大量数据的查询性能。 11. **相关约束**:主键...
- **SSB(Star Schema Benchmark)测试**:评估数据库在星型模型下的性能表现。 - **数据压缩比例**:比较不同数据库的数据压缩效果。 - **多节点支持**:考察数据库在分布式环境中的表现。 #### 七、总结与建议 ...
- **星型模式(Star Schema)设计** - **Siebel Data Warehouse的设计原理** - **维度模型的应用** #### 详细解析 ##### OLTP与OLAP数据库的区别 - **OLTP(在线事务处理)**: 主要用于支持企业的日常业务操作,...
在关系数据库中,主要的数据模式有两种:星型模式(Star Schema)和雪花模式(Snowflake Schema)。 - **星型模式**:此模式下,数据被组织成中心事实表与周围维度表的形式。事实表包含了业务数据的关键指标,而...
技能包括: 使用PostgreSQL创建一个关系数据库使用事实和维度表的优化定义开发了一个Star Schema数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 能力包括:Python,PostgreSql,Star ...
还提到了fact table(事实表)、dimension table(维度表)和star schema(星型模式),这些是数据仓库设计中常用的概念。 12. Oracle数据库索引类型:文档中提到了bitmap index(位图索引),这是Oracle数据库中一...
### 星型模式(Star Schema) 星型模式是一种广泛应用于数据仓库的设计方法。在这种设计中,一个中央的事实表与多个维度表相连,形成类似星星的结构。星型模式的主要优点是简单直观、易于理解和查询。 ### 区段...
#### 星型模式(Star Schema) - 星型模式是一种常见的数据仓库设计,其中心表(事实表,Fact Table)与外围表(维度表,Dimension Table)之间形成辐射状结构。事实表存储具体业务数据,而维度表则提供对事实数据的...
* 星型模式(Star Schema)是一种常见的数据仓库模式,维度(Dimension)是数据仓库的重要组成部分。 * Azure Synapse Analytics 的大规模并行处理(MPP)引擎可以跨计算节点分布处理。 三、数据分析 * 认知诊断...
星型模式(Star Schema) ------------------------- ROLAP 中的星型模式是指事实表和维表的结合。事实表用于存储事实的度量值和各个维的码值,维表用于存放维的元数据(维的层次、成员类别等描述信息)。 OLAP ...
1. **星型模式(Star Schema)**: 星型模式由一个事实表和一组维度表组成。每个维度表有一个维作为主键,这些主键共同构成事实表的主键。事实表包含数值型的事实,而维度表则包含文本、时间等非数值数据。通过这种...
星型模式(Star Schema)中的两类表及其数据类型 - **Fact Tables**:存储大量关键业务数据。 - **Dimension Tables**:提供对事实表属性的描述性信息。 #### 10. Fact Table应建立何种索引? Fact Table上推荐...
知识点:星型架构(Star Schema) 星型架构是一种简单的数据仓库方案,它以事实表为中心,周围围绕着多个维度表。星型架构便于执行快速查询,常用于数据分析和报表生成。 5. 数据库规范化 知识点:规范化的目的和...
- **星型模型(Star Schema)**:是最常见的数据仓库模型,由事实表和维度表组成,结构简单,查询效率高,易于理解。 - **雪花模型(Snowflake Schema)**:是星型模型的扩展,维度表进一步细分,形成多级层次,...