1 模型就是抽象化
这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。
2 举一个小例子
现实世界 概念世界 逻辑世界 计算机世界
信用 特性 属性 列(字段、数据项)
张三 个体 实体 记录
客户 整体 同质总体 表文件
客户与产品 整体间联系 异质总体 数据库
3. 数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描述数据和细节数据
4 数据仓库物理模型的优化问题
1.合并表:几个表的记录分散存放在几个物理块中时,多个表的存取和连接操作的代价会很大。
2.建立数据序列:按照某一固定的顺序访问并处理一组数据记录。将数据按照处理顺序存放到连续的物理块中,形成数据序列。
3.引入冗余:一些表的某些属性可能在许多地方都要用到,将这些属性复制到多个主题中,可以减少处理时存取表的个数。
4.表的物理分割:每个主题中的各个属性存取频率是不同的。将一张表按各属性被存取的频率分成两个或多个表,将具有相似访问频率的数据组织在一起。
5.生成派出数据:在原始数据的基础上进行总结或计算,生成派出数据,可以在应用中直接使用这些派出数据,减少I/O次数,免去计算或汇总步骤,在更高级别上建立了公用数据源,避免了不同用户重复计算可能产生的偏差。
5 。
从用户的角度分析
从技术的角度分析
6 。
1.索引创建策略
建立索引时,按照索引使用的频率,由高到低逐步添加。
按主关键字和大多数外部关键字建立索引
2.事实表索引的创建
事实表中一定要设置主键
3.维表索引的创建
4.数据加载索引的创建
关系型数据库、多维数据库和对象数据库 。
5 多维数据库
总结起来就是:横向的是一个空间。(一张表) 纵向又是一个空间。(一张表)。
1.MOLAP的创建
阶段:
选择功能
确定分析数值
构造分析维
定义逻辑模型
数据库设计的部分:
举例:用PERSON 实体和PERSON_TYPE 实体来描述人员。比方说,当John Smith, Engineer 提升为John Smith, Director 乃至最后爬到John Smith, CIO 的高位,而所有你要做的不过是改变两个表PERSON 和PERSON_TYPE 之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE 表就包含了所有PERSON 的可能类型,比如Associate、Engineer、Director、CIO 或者CEO 等。还有个替代办法就是改变PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的具体时间。
此例子:说明了处理的一种方式、。多角度考虑问题。
复合主键:
Create Table 表名 (字段名1 Int Not Null,
字段名2 nvarchar(13) Not Null Primary Key (字段名1, 字段名2), 多个字段标示唯一的实体。
在SQL查询效率上 复合主键和单主键 都是一样。 但是 操作来说只是要比单个的主键复杂一些。
分享到:
相关推荐
数据仓库是一种专为决策支持系统服务的数据库系统,它的出现源于操作型数据库无法满足复杂的决策分析需求。在数据仓库领域,W.H. Inmon被尊称为“数据仓库之父”,他在1992年的著作《Building the Data Warehouse》...
### 数据仓库关键技术与实践 #### 一、数据仓库概述 数据仓库(Data Warehouse)作为一种新型的数据管理技术,其核心在于为联机分析处理(OLAP)提供了全面的解决方案。与传统的关系数据库相比,数据仓库更加关注...
实验总结指出,基于“学生成绩分析”的数据仓库模型对高校教学管理具有实用价值,为进一步的数据挖掘奠定了基础。通过实际操作,学生不仅能理解数据仓库的构建过程,还能体会到数据挖掘在揭示隐藏信息和模式上的潜力...
3. **大数据之数据仓库**:深入理解大数据环境下的数据仓库建设,如Hadoop数据仓库(Hadoop Data Warehouse)的设计原则、架构优化和性能提升策略。 4. **数据仓库、大数据平台和数据中台三者之间的关系**:数据...
### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...
总结来说,数据治理确保了数据资产的管理质量,而数据仓库模型设计提供了数据应用和分析的平台。两者相互配合,共同支撑企业应对大数据时代的挑战,发掘数据价值,实现业务增长和创新。随着技术的不断进步,数据治理...
数据仓库维度建模是构建高效、可理解且易于分析的数据仓库的关键步骤。在这个过程中,我们需要考虑如何有效地组织数据,使其能够支持复杂的业务查询和报告需求。以下是对维度建模的一些重要概念和步骤的详细说明: ...
### 数据仓库与数据挖掘课程设计知识点详解 #### 一、项目背景及提出问题 - **项目背景**: 在当前的大数据时代背景下,无论是哪个行业都需要对商品及其相关环节的数据进行有效的收集与处理。特别是零售行业,通过对...
总结来说,这个课程设计方案报告通过实际案例,让学生深入理解和应用数据仓库的构建、OLAP分析以及数据挖掘技术,旨在培养他们在数据分析和决策支持方面的能力,为他们未来在人工智能领域的职业发展奠定坚实基础。
根据提供的文件信息,我们可以深入探讨数据仓库生命周期工具箱的关键知识点,包括设计、开发与配置数据仓库的方法论。本书旨在为读者提供一个全面的数据仓库构建指南,涵盖了从项目管理到最终部署的所有步骤。以下是...
总结来说,大数据中台、数据仓库、大数据平台和数据治理共同构成了企业大数据应用的基石。理解并掌握这些概念和技术,对于构建企业级大数据解决方案至关重要,它们帮助企业充分利用数据资产,驱动业务创新和发展。
在旺季总结会议上,B主任的报告因其简洁、准确和高效而受到认可,这充分体现了数据仓库在决策支持中的价值。 数据仓库的核心优势在于其对数据的预处理、清洗和整合能力。它能够处理来自不同来源的数据,消除数据...
### 数据仓库和数据集市 #### 一、背景与起源 数据仓库的概念最早出现在20世纪80年代中期,它的出现主要是为了解决企业内部决策支持系统中存在的诸多问题。早期的企业决策支持系统通常由一系列分散的报表系统组成...
数据仓库与在线分析处理(OLAP)是信息技术领域中的关键组成部分,主要用于大数据的存储、管理和分析。本实验旨在深入理解这两个概念以及它们在实际应用中的作用。通过参与实验,你可以获得以下关键知识点: 1. **...
实验总结强调了通过实践掌握了数据仓库的需求分析方法和多维表设计,同时也熟练了SQL Server Management Studio的数据库管理和关系表管理功能。此外,实验还涉及了数据预处理,如使用数据透视表和透视图进行销售数据...
最后,"数据仓库应用及未来发展.pdf"将总结数据仓库的广泛应用场景,探讨其在物联网、人工智能、机器学习等新兴领域的潜力,以及如何适应快速变化的数字化环境。 这些期刊资料集合为深入理解和研究数据仓库提供了...
根据提供的信息,我们可以总结出以下关于《数据仓库工具箱》第三版的重要知识点: ### 一、书籍基本信息 - **书名**:《数据仓库工具箱》第三版(The Data Warehouse Toolkit Third Edition) - **作者**:Ralph ...