关系数据库的关键之处在于关系的分解,在数据库中只定义了数据之间的两两关系,与应用相
关的更复杂的数据关系需要在运行时通过动态join来构造出来,即这些关系储存在程序中而不是数据库中。实际上,关系数据库的一个隐含的假定是数据之间很
少关联,而在实际应用中单表和主从表也正是最常出现的情况。当一个应用频繁需要大量表的连接操作的时候,往往意味着关系数据模型的失效,此时我们将不得不
放弃数据的无冗余性,需要通过预连接来构造实例化视图(Material View),将数据之间的复杂关系固化并明确定义出来。
在数据仓库里,抽象的讨论star schema和snowflake schema哪个更优越是一个毫无意义的问题。
应该聚合到什么程度,需要根据数据应用的具体情况而定。
关系数据库本身定义的是数据之间的两两关系,缺乏一些全局数据访问手段。而数据仓库的一个基本概念是数据空间,即可以通过全局坐标来直接访问数据,而不是
通过两两连接来访问数据。在数据仓库中最重要的就是时间维度,因为这是所有数据所共享的一个坐标维度。我们可以将两个发生在同一时间点上的数据直接并列在
一起,而无论它们之间是否定义了关联(relation)。
关系数据库的基本数据访问模式如下:
select 属性列表
from 表A, 表B
where 表A.data_id = 表B.id
and 表B.attr = 'A'
在数据仓库中 " from 表A, 表B where 表A.data_id = 表B.id "这一部分将多个多个数据表和表之间的关联条件放在一起定义为所谓的主题。
而 表B.attr = 'A' 这一部分就从where子句中分离出来作为坐标条件。
在数据仓库中建立时间坐标有两种方式,对于发生在时间点上的事件我们直接建立点坐标,通过his_date字段来表示,而对于延续一段时间的状态数据,我们可以建立区间坐标,通过from_date和to_date两个字段来表示。
分享到:
相关推荐
- **数据管理**:数据成功导入数据仓库后,应清空分段存储区,保持其作为临时缓存的角色。 #### 数据仓库主体 这是数据仓库的核心区域,存储经过加工、整合后的高质量数据,支撑各种复杂查询与分析任务。 #### ...
数据仓库建模与数据分析是企业信息化过程中的关键环节,它涉及到数据仓库的架构设计、粒度选择、维度建模以及数据的转换与分析。在这个关卡中,我们主要讨论了三种常见的数据仓库架构,粒度和维度的概念,并进行了...
5. **逆向工程**:如果已经有了现有的数据仓库,可以通过Rational Rose的逆向工程功能,从数据库中导入现有结构,生成对应的模型,这有助于理解和优化现有的架构。 6. **文档生成**:模型完成后,可以导出为文档,...
在操作类型上,数据库频繁进行增删改操作,而数据仓库主要通过批量导入和定期更新。系统建设方法上,数据库常采用系统开发生命周期法(SDLC),而数据仓库更倾向于从数据出发的螺旋式开发(CLDS)。 企业级数据仓库...
数据仓库(Data Warehouse)是企业用于存储、管理和分析大量结构化数据的重要工具,其核心在于数据建模。在"EDWDM数据仓库数据建模模型设计.pptx"中,我们看到的是关于企业数据仓库(Enterprise Data Warehouse,EDW...
### 数据仓库建模与ETL的实践技巧 #### 一、什么是BI(Business Intelligence) **1.1 BI的定义** BI(Business Intelligence),即商务智能,是一种帮助企业利用数据提高决策质量的技术集合。它通过从大量数据中...
- **数据源**:来自不同系统的原始数据,需要经过ETL过程才能导入数据仓库。 - **事实表**:存储具体数值数据(如销售额、数量等),位于星型或雪花型架构的中心。 - **维度表**:提供事实表中数据的上下文信息,如...
【Chiner数据建模软件】是一款兼顾美观与实用性的开源数据建模工具,它提供了丰富的功能,旨在替代如PowerDesigner等传统...在数据仓库项目中,Chiner能够有效提升工作效率,减少重复工作,值得广大开发者尝试和使用。
4. 数据建模:在数据仓库中,数据通常按照星型、雪花型或其他关系模式进行组织,以支持高效的查询和分析。Hive或Impala等工具可以帮助创建这些数据模型。 5. 数据加载:完成数据预处理和建模后,可以将数据加载到...
此外,数据仓库的多维建模是关键,它允许用户从不同角度(维度)查看数据,例如按地理位置、时间、房屋类型等进行分析。 OLAP技术在数据仓库中的应用提供了多维数据分析的能力,包括切片(选择特定维度的一段)、切...
在本章节中,我们将深入探讨数据仓库的建模方法论,包括其设计目标、构建流程、以及如何通过有效的建模技术提高数据的可访问性和准确性。 #### 数据仓库建模方法论 **设计数据仓库的目标:** 1. **易于访问性:**...
PowerDesigner Warehouse Architect提供了强大的元数据导入功能,可以从现有的数据库、数据字典或第三方模型中自动获取元数据,作为数据仓库建模的起点。这一步骤极大地减少了手动输入的工作量,并确保了模型与现有...
#### 1.3 数据仓库建模 - **星型模型**:以事实表为中心,周围围绕着一个或多个维度表。 - **雪花模型**:维度表进一步细化为更多的维度表,形成类似雪花的结构。 - **星座模型**:多个星型模型相互关联形成的复杂...