`

数据仓库 三

阅读更多

 

数据仓库数据导入:

格式化

获取传统数据库更新数据 1.时间戳  2.增量文件 3.日志文件 4.嵌入代码 5.前后映像

时基变化 数据必须附有时间元素

 

----------------------------------

 

数据模型 information system architecture

 

有三个层次:1.高层建模(ERD实体关系层)

            2.中间层建模(DIS数据项集)

            3.底层建模(物理层)

1.高层建模(ERD实体关系层)

用实体和箭头描述,通过不同视角描绘出的ERD图的总和

 

2.中间层建模(DIS数据项集)

对ERD中的每个实体,都要建立一个中间层模型

1.初始数据组:键码+属性

2.二次数据组

3.连接件

4.数据类型(拓展出来的数据组)

每个数据组都通常表示一张表

 

3.物理模型

是基于中间层建模的结果,创建实际物理存储

3.1节省IO,将经常用到并且很少更新的数据作为冗余存储在表中(摘要描述作为冗余)

3.2按照访问频率拆分数据到不同的表中(银行账户,余额作为单独的表存储)

3.3存储计算结果(每月的消费存储在消费表中,可用于每年消费计算)

3.4数据仓库需要“创造的索引”(为终端用户感兴趣的项目建立一个概要文件,包括最大消费,最不活跃的账户,最近的发货等等)

3.5数据参考完整性,在操作型环境中数据之间的动态连接,在数据仓库中数据量打,数据不更新,数据按时间标示,关系不静态,面向多种业务,需要“人工关系”(初始数据和二次数据的关系),人为添加的

 

------------------------------------------------------------------

 

数据快照

包括:键码,时间,初始数据,二次数据(如销售产品,销售时间,产品信息,销售时股票优惠等信息)

 

-------------------------------------------------------------------

 

元数据记录在数据仓库的位置

程序数据结构

DSS数据结构

源数据

数据加入数据仓库的转换

数据模型

数据模型和数据仓库的关系

抽取数据的历史记录

 

---------------------------------------------------------------------

 

事件触发仓库快照机制

 

----------------------------------------

 

即时策略

1.1(定时计算)使用脱机计算和定期分析进行,将当前数据(关系数据库)和计算好的历史的中间计算结果作为输入,进行脱机计算

1.2(个性化)个性化计算,将数据仓库中的数据,进行个性化分析,对一个ID进行分析(上次购货日期,上次购货项目,市场分类,体验情况),个性化对于销售人员,人事都有意义

1.3(转变需求)信息审核,在贷款时,为了分析用户信用,需要大量历史数据计算偿还历史,私有财产,收入等等;可以提供预核准,预分析程序,计算1.客户识别信息2.核准信贷限制3.特殊的核准限制

 

----------------------------------------

 

 

星型连接

数据最大的作为主表,其他表都跟主表有关联,称为维表

对于DSS系统,星型模型在处理冗余数据,获得管理数据有优势

对于其他系统,在更新操作过多时,管理星型模型缺点太多

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    数据仓库3-数据仓库中的数据及组织.pptx

    在信息技术飞速发展的今天,数据仓库作为数据分析的核心组件,在财务管理领域发挥着至关重要的作用。它不仅满足了操作型处理(OLTP)的需求,还兼顾了分析型处理(OLAP)的深度分析,实现了企业数据的全方位管理。接...

    【推荐】数据仓库建设学习资料合集(38份).zip

    推荐,数据仓库建设学习资料合集,包含建设规范、架构、工具及模型等资料。共38份。 2021数据仓库服务常见问题-华为-51页 2021云数据仓库专业服务-华为-168页 阿里云数据中台-金融行业新一代数据仓库解决方案 ...

    数据仓库-inmon版

    在数据仓库的数据模型设计方面,Inmon提出了3NF(第三范式)模型来确保数据的一致性和减少数据冗余。Inmon认为数据仓库中的数据应当具备历史维度,以保留数据的历史状态,这对于回溯性分析至关重要。此外,Inmon还...

    3万字38页《数据仓库知识体系》.pdf

    本文档《数据仓库知识体系》详细整理了数据仓库领域几乎所有的知识点,覆盖了数据仓库的多个方面,从发展阶段、数据模型、事实表设计、多维体系结构、规范设计、元数据管理、维度表设计、范式和反范式化、数据仓库...

    数据仓库,数据仓库入门

    第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59...

    数据仓库与数据挖掘(陈志泊)课后习题答案1

    3. **OLAP(在线分析处理)**:是数据仓库中常用的技术,允许用户快速、多维度地分析数据,支持切片、钻取和滚动生成报告。 4. **数据抽取、转换和加载(ETL)**:数据从源头抽取,经过清洗、转换,然后加载到数据...

    数据仓库设计说明书

    第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59...

    数据仓库ETl工具箱3.pdf

    ### 数据仓库与ETL工具箱概念 在企业信息化过程中,数据仓库作为核心组件,承担着存储、处理和提供决策支持数据的职责。ETL(抽取、转换、加载)是数据仓库建设的关键环节,负责从业务系统中抽取数据,经过清洗、...

    数据仓库教程(陈文伟)

    陈文伟的教程还可能涉及到数据仓库的最新发展,如云计算中的数据仓库(云数据仓库)、大数据处理框架(如Hadoop和Spark)对数据仓库的影响,以及现代数据仓库工具如Amazon Redshift、Google BigQuery和Snowflake等。...

    数据仓库工具箱第三版(英文)

    根据提供的信息,我们可以总结出以下关于《数据仓库工具箱》第三版的重要知识点: ### 一、书籍基本信息 - **书名**:《数据仓库工具箱》第三版(The Data Warehouse Toolkit Third Edition) - **作者**:Ralph ...

    数据仓库的数据采集

    在数据仓库的建设中,源数据、数据准备和数据呈现是三个关键部分。源数据是原始业务系统中的数据,数据准备包括有效性检查、清除和转换,以确保数据质量。数据呈现则涉及OLAP分析和决策支持,是用户直接交互的部分。...

    数据仓库与数据挖掘课程设计.docx

    #### 三、数据仓库的设计与建立 - **概念模型设计**: 概念模型设计是整个数据仓库设计的基础,主要包括星型模型和雪花型模型的设计。这些模型可以帮助理解数据之间的关系,并为后续的数据仓库建立提供框架。 - **...

    大数据中台、数据仓库、大数据平台、数据治理经验总结.rar

    3. **大数据之数据仓库**:深入理解大数据环境下的数据仓库建设,如Hadoop数据仓库(Hadoop Data Warehouse)的设计原则、架构优化和性能提升策略。 4. **数据仓库、大数据平台和数据中台三者之间的关系**:数据...

    论文研究-基于统一视图的数据仓库体系结构及其构建方法.pdf

    基于该体系结构,给出了统一视图模型的建立和数据仓库三层之间两级映射的方法,提出了一种新的基于统一视图模型的数据映射—抽取—装载数据仓库ETL建模过程,并开发了相应的数据仓库构建系统。应用表明,

    数据仓库与数据挖掘 阶段考试复习题.docx

    数据仓库的三级模型包括概念模型、逻辑模型和物理模型。概念模型定义了一个映射序列,可以将低层概念映射到更一般的高层概念。逻辑模型包括星型模型、雪花模型和事实星座模型等。物理模型是数据仓库的实际实现。 ...

    数据仓库和数据集市

    3. **数据整合**:数据仓库通常涉及来自多个数据源的数据整合,而数据集市更多的是基于已经整合的数据进行加工。 4. **更新频率**:数据仓库中的数据更新频率较低,强调的是历史数据的保存和利用;数据集市中的数据...

    本书论述在设计和建造数据仓库中涉及的所有主要问题,论述分析型环境(决策支持系统环境)以及在这种环境中的数据构造。主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。

    第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59...

    数据仓库工具箱-维度建模权威指南-第3版

    《数据仓库工具箱——维度建模权威指南》第三版是一本深入探讨数据仓库设计与构建的专业书籍,尤其在维度建模领域提供了详尽的指导。维度建模是数据仓库设计的核心技术,它使得业务分析和决策支持变得更加高效、直观...

Global site tag (gtag.js) - Google Analytics