数据仓库分层的原因
1通过数据预处理提高效率,因为预处理,所以会存在冗余数据
2如果不分层而业务系统的业务规则发生变化,就会影响整个数据清洗过程,工作量巨大
3通过分层管理来实现分步完成工作,这样每一层的处理逻辑就简单了
标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层)
ods:历史存储层,它和源系统数据是同构的,而且这一层数据粒度是最细的,这层的表分为两种,一种是存储当前需要加载的数据,一种是用于存储处理完后的数据。
pdw:数据仓库层,它的数据是干净的数据,是一致的准确的,也就是清洗后的数据,它的数据一般都遵循数据库第三范式,数据粒度和ods的粒度相同,它会保存bi系统中所有历史数据
mid:数据集市层,它是面向主题组织数据的,通常是星状和雪花状数据,从数据粒度将,它是轻度汇总级别的数据,已经不存在明细的数据了,从广度来说,它包含了所有业务数量。从分析角度讲,大概就是近几年
app:应用层,数据粒度高度汇总,倒不一定涵盖所有业务数据,只是mid层数据的一个子集。
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持。数据仓库的context也可以理解为:数据源,数据仓库,数据应用
数据仓库可以理解为中间集成化数据管理的一个平台
etl(抽取extra,转化transfer,装载load)是数据仓库的流水线,也可以认为是数据仓库的血液。
数据仓库的存储并不需要存储所有原始数据,因为比如你存储冗长的文本数据完全没必要,但需要存储细节数据,因为需求是多变的,而且数据仓库是导入数据必须经过整理和转换使它面向主题,因为前台数据库的数据是基于oltp操作组织优化的,这些可能不适合做分析,面向主题的组织形式才有利于分析。
多维数据模型就是说可以多维度交叉查询和细分,应用一般都是基于联机分析处理(online analytical process OLAP),面向特定需求群体的数据集市会基于多位数据模型构建
而报表展示就是将聚合数据和多维分析数据展示到报表,提供简单和直观的数据。
元数据,也叫解释性数据,或者数据字典,会记录数据仓库中模型的定义,各层级之间的映射关系,监控数据仓库的数据状态和etl的任务运行状态。一般通过元数据资料库来统一存储和管理元数据。
相关推荐
数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于1990年提出,主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,...
Teradata作为全球领先的企业级数据仓库解决方案提供商,其产品和架构设计原理对于理解数据仓库技术至关重要。本知识点将围绕Teradata数据仓库技术架构进行详细介绍,并深入解析整体架构和ETL架构的概念与应用。 ###...
Oracle 数据仓库的分层管理器解决方案是针对大数据时代地学空间数据存储、分析与管理问题提出的创新性技术。随着Oracle数据库技术的发展,尤其是Oracle Spatial的引入,数据仓库在处理海量数据方面表现出强大的性能...
数据仓库中的数据通常按照业务需求进行分层,例如分为运营数据、外部数据等。Oracle9i ETL引擎支持高效的数据集成,同时,Oracle OLAP(在线分析处理)提供强大的分析功能,用于复杂的数据挖掘和业务智能应用。商业...
数仓分层是指数据仓库架构设计文档中关于数据仓库的分层结构的介绍。该部分内容主要介绍了数据仓库的分层结构、每层的作用和特点、数据流转过程等方面的内容。 数据分类架构是指数据仓库架构设计文档中关于数据分类...
哈尔滨银行的数据仓库总体架构设计旨在实现这一目标,包括四个主要组成部分:总体架构、物理架构、技术架构和数据架构。 1. **总体架构**: 哈尔滨银行的数据应用总体架构涵盖了数据采集、数据整合、数据推送和...
"数仓建模方法和数仓分层架构详解" 数仓建模是指对业务的理解,将各种数据进行整合和关联,并最终使得这些数据可读性和可用性增强,让用户能够快速获取有价值的信息并及时作出响应,为公司带来效益。数据建模是对...
一个明确的数据仓库分层结构图,针对数据仓库的层次介绍和内容简明。
同时,书中还会详细讲解如何设计数据仓库的架构,包括星型模式、雪花模式等常见的数据模型设计。 数据仓库的建设过程中,ETL过程起着关键作用。本书会深入讨论如何从各种异构数据源中抽取数据,如何对数据进行清洗...
在“数据仓库入门经典教程.pdf”中,你可能会学习到关于数据仓库的基本概念,包括数据仓库的架构、ETL过程、数据模型设计以及如何选择合适的数据仓库工具。此外,教程可能还会涵盖数据仓库项目管理、性能优化和安全...
#### 四、数据仓库架构的分层 数据仓库的架构通常分为以下几个层次: 1. **源系统**:业务系统的原始数据。 2. **数据集成层**:数据抽取、清洗、转换和加载(ETL)的过程。 3. **数据仓库层**:存放经过整合的数据...
3. **数据仓库的分层**:数据仓库通常分为ODS(操作数据存储)、DWH(数据仓库)和数据集市三层。ODS靠近源系统,保存最近的数据,便于快速访问;DWH是主体仓库,进行更复杂的清理和转换;数据集市是面向特定主题的...
2. **数据仓库架构**:掌握数据仓库的三层架构(源系统、ETL(提取、转换、加载)和数据仓库本身),以及OLAP(在线分析处理)和OLTP(在线事务处理)的区别。 3. **ETL过程**:深入理解数据抽取、清洗、转换和加载...
4. 数据分层:数据仓库通常分为多个层次,包括原始数据层(ODS)、数据 mart 和数据集市,以及最终的分析层。ODS保留原始数据,数据 mart 和数据集市是对特定主题区域的精炼,分析层则提供预计算的汇总数据,以加速...
标题中提到的“新一代数据仓库OushuDB架构剖析”指的是对中国新兴的分析型数据库OushuDB的结构和技术细节的深入分析。OushuDB是基于PostgreSQL打造的,它不仅集成了原生的Hadoop并行SQL引擎,还面向企业提供了一个...
- **分层架构**: 通常包括原始数据层、整合层和分析层,每一层都有其特定的目的和处理逻辑。 - **元数据管理**: 元数据记录了数据的来源、转换规则、存储位置等重要信息,对于维护数据质量和可追溯性至关重要。 - **...
综上所述,集团企业在构建数据仓库时,需要从业务需求出发,通过精心设计的数据模型和分层架构,选用合适的ETL和数据管理工具,并持续进行系统优化与维护,才能确保数据仓库能够有效地支持企业的决策制定和发展战略...
数据仓库的分层架构也是设计中的一大问题。常见的层次包括ODS(操作数据存储)、DWD(数据仓库细节层)、DWS(数据仓库汇总层)和ADS(应用数据服务)。每个层次都有其特定的功能和粒度,用于满足不同层次的分析需求...
同时,也会涵盖数据仓库的分层架构,如ODS(操作数据存储)、DWH(数据仓库)和DM(数据集市)等。 3. **ETL工具**:详细解析各种流行的ETL工具,如Informatica、Talend、IBM DataStage等,介绍它们的功能特性、...