数据仓库数据导入:
格式化
获取传统数据库更新数据 1.时间戳 2.增量文件 3.日志文件 4.嵌入代码 5.前后映像
时基变化 数据必须附有时间元素
----------------------------------
数据模型 information system architecture
有三个层次:1.高层建模(ERD实体关系层)
2.中间层建模(DIS数据项集)
3.底层建模(物理层)
1.高层建模(ERD实体关系层)
用实体和箭头描述,通过不同视角描绘出的ERD图的总和
2.中间层建模(DIS数据项集)
对ERD中的每个实体,都要建立一个中间层模型
1.初始数据组:键码+属性
2.二次数据组
3.连接件
4.数据类型(拓展出来的数据组)
每个数据组都通常表示一张表
3.物理模型
是基于中间层建模的结果,创建实际物理存储
3.1节省IO,将经常用到并且很少更新的数据作为冗余存储在表中(摘要描述作为冗余)
3.2按照访问频率拆分数据到不同的表中(银行账户,余额作为单独的表存储)
3.3存储计算结果(每月的消费存储在消费表中,可用于每年消费计算)
3.4数据仓库需要“创造的索引”(为终端用户感兴趣的项目建立一个概要文件,包括最大消费,最不活跃的账户,最近的发货等等)
3.5数据参考完整性,在操作型环境中数据之间的动态连接,在数据仓库中数据量打,数据不更新,数据按时间标示,关系不静态,面向多种业务,需要“人工关系”(初始数据和二次数据的关系),人为添加的
------------------------------------------------------------------
数据快照
包括:键码,时间,初始数据,二次数据(如销售产品,销售时间,产品信息,销售时股票优惠等信息)
-------------------------------------------------------------------
元数据记录在数据仓库的位置
程序数据结构
DSS数据结构
源数据
数据加入数据仓库的转换
数据模型
数据模型和数据仓库的关系
抽取数据的历史记录
---------------------------------------------------------------------
事件触发仓库快照机制
----------------------------------------
即时策略
1.1(定时计算)使用脱机计算和定期分析进行,将当前数据(关系数据库)和计算好的历史的中间计算结果作为输入,进行脱机计算
1.2(个性化)个性化计算,将数据仓库中的数据,进行个性化分析,对一个ID进行分析(上次购货日期,上次购货项目,市场分类,体验情况),个性化对于销售人员,人事都有意义
1.3(转变需求)信息审核,在贷款时,为了分析用户信用,需要大量历史数据计算偿还历史,私有财产,收入等等;可以提供预核准,预分析程序,计算1.客户识别信息2.核准信贷限制3.特殊的核准限制
----------------------------------------
星型连接
数据最大的作为主表,其他表都跟主表有关联,称为维表
对于DSS系统,星型模型在处理冗余数据,获得管理数据有优势
对于其他系统,在更新操作过多时,管理星型模型缺点太多
相关推荐
在信息技术飞速发展的今天,数据仓库作为数据分析的核心组件,在财务管理领域发挥着至关重要的作用。它不仅满足了操作型处理(OLTP)的需求,还兼顾了分析型处理(OLAP)的深度分析,实现了企业数据的全方位管理。接...
推荐,数据仓库建设学习资料合集,包含建设规范、架构、工具及模型等资料。共38份。 2021数据仓库服务常见问题-华为-51页 2021云数据仓库专业服务-华为-168页 阿里云数据中台-金融行业新一代数据仓库解决方案 ...
本文档《数据仓库知识体系》详细整理了数据仓库领域几乎所有的知识点,覆盖了数据仓库的多个方面,从发展阶段、数据模型、事实表设计、多维体系结构、规范设计、元数据管理、维度表设计、范式和反范式化、数据仓库...
第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59...
### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...
3. **OLAP(在线分析处理)**:是数据仓库中常用的技术,允许用户快速、多维度地分析数据,支持切片、钻取和滚动生成报告。 4. **数据抽取、转换和加载(ETL)**:数据从源头抽取,经过清洗、转换,然后加载到数据...
第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59...
### 数据仓库与ETL工具箱概念 在企业信息化过程中,数据仓库作为核心组件,承担着存储、处理和提供决策支持数据的职责。ETL(抽取、转换、加载)是数据仓库建设的关键环节,负责从业务系统中抽取数据,经过清洗、...
陈文伟的教程还可能涉及到数据仓库的最新发展,如云计算中的数据仓库(云数据仓库)、大数据处理框架(如Hadoop和Spark)对数据仓库的影响,以及现代数据仓库工具如Amazon Redshift、Google BigQuery和Snowflake等。...
根据提供的信息,我们可以总结出以下关于《数据仓库工具箱》第三版的重要知识点: ### 一、书籍基本信息 - **书名**:《数据仓库工具箱》第三版(The Data Warehouse Toolkit Third Edition) - **作者**:Ralph ...
#### 三、数据仓库的设计与建立 - **概念模型设计**: 概念模型设计是整个数据仓库设计的基础,主要包括星型模型和雪花型模型的设计。这些模型可以帮助理解数据之间的关系,并为后续的数据仓库建立提供框架。 - **...
3. **大数据之数据仓库**:深入理解大数据环境下的数据仓库建设,如Hadoop数据仓库(Hadoop Data Warehouse)的设计原则、架构优化和性能提升策略。 4. **数据仓库、大数据平台和数据中台三者之间的关系**:数据...
基于该体系结构,给出了统一视图模型的建立和数据仓库三层之间两级映射的方法,提出了一种新的基于统一视图模型的数据映射—抽取—装载数据仓库ETL建模过程,并开发了相应的数据仓库构建系统。应用表明,
3. **数据整合**:数据仓库通常涉及来自多个数据源的数据整合,而数据集市更多的是基于已经整合的数据进行加工。 4. **更新频率**:数据仓库中的数据更新频率较低,强调的是历史数据的保存和利用;数据集市中的数据...
第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59...
《数据仓库工具箱——维度建模权威指南》第三版是一本深入探讨数据仓库设计与构建的专业书籍,尤其在维度建模领域提供了详尽的指导。维度建模是数据仓库设计的核心技术,它使得业务分析和决策支持变得更加高效、直观...