`
suifeng
  • 浏览: 181448 次
  • 性别: Icon_minigender_1
  • 来自: 天津
社区版块
存档分类
最新评论

数据仓库新玩法---横纵式DW + 横纵式ETL

阅读更多

 

从用途说起

 

DW : 用于分析的数据平台

ODS : 用于过渡的转换平台

 

ODS

1, 集中

   将不同数据库,不同数据源的数据统一集中存储

 

2, 隔离

   通过ODS隔离数据仓库和业务系统数据库, 可减轻对业务系统的压力

 

3, 实时+明细

   存储实时的明细数据, 可以据此生成报表

 

横式DW + 横式ETL 替代 ODS

1, 集中异构数据源

   将不同数据库,不同数据源的数据统一集中存储到此仓库内

 

2, 横向抽取

   只做横向抽取(抽取需要的行), 即是表结构不变, 只抽取历史数据,对于那些刚保存,或没有审批通过的数据不抽取.

 

3, 定时抽取

   按照抽取策略定时抽取, 如:秒级, 分级, 时级.

 

纵式DW + 纵式ETL  面向分析

1, 纵向抽取

   在横式DW基础上进行纵向抽取(抽取需要的列)形成待分析数据

 

2,统计分析

  存储按维度进行统计后的数据或者原始数据,用于统计分析

 

说明 : 横向抽取==抽取需要的行,  纵向抽取==抽取需要的列

 

刚想出来, 欢迎评论, 欢迎拍砖, 欢迎批评, 欢迎建议, 正要在项目中实践.

 

 

2
1
分享到:
评论

相关推荐

    go-etl是一个集数据源抽取,转化,加载的工具集,提供强大的离线数据同步能力。.zip

    在大数据处理领域,ETL是至关重要的一步,它允许我们将来自不同来源的数据进行整合、清洗,并导入到目标系统中,如数据库或数据仓库。Go-Etl的出现,使得这一过程更加便捷和高效。 首先,让我们深入了解一下Go-Etl...

    数据仓库DW政府方案-完整版

    数据仓库DW政府方案是针对政府机构在信息化进程中对大数据管理和分析需求的一种综合解决方案。这个方案主要涉及了数据仓库(Data Warehouse)的构建、商务智能(Business Intelligence, BI)的应用、数据加工与集成...

    数据仓库-ETL和元数据

    数据仓库(Data Warehouse, DW)是一种用于存储和管理海量数据的特殊类型的数据库,主要用于支持企业的商业智能(BI)活动,特别是数据分析和决策制定。它通过整合来自不同源的数据,并将其转化为适合于分析的形式,从而...

    传统数据仓库ETL设计报告

    《传统数据仓库ETL设计报告》 ETL(Extract, Transform, Load)是数据仓库建设中的关键步骤,涉及从源系统提取数据、转换数据格式和结构,并加载到目标数据仓库的过程。本报告主要探讨了ETL的升级策略,尤其是如何...

    DW-ETL-Informatica-面试题库

    在IT行业的数据仓库(Data Warehouse,简称DW)与数据集市(Data Mart)领域,以及具体到ETL(Extract, Transform, Load)工具如Informatica的应用,存在一系列关键知识点,尤其对于准备参加相关职位面试的候选人而...

    Python库 | band-etl-0.0.3.tar.gz

    《Python库band-etl-0.0.3:ETL处理与数据仓库构建的利器》 在信息技术领域,数据处理是至关重要的环节,而ETL(Extract, Transform, Load)正是这种处理的核心部分。Python作为一种功能强大且易学易用的编程语言,...

    【推荐】数据仓库建设学习资料合集(38份).zip

    阿里云数据中台-金融行业新一代数据仓库解决方案 分布式数据仓库 构建可靠的数据仓库 模板-数据仓库整体设计方案 企业大数据平台数仓架构建设思路 商业银行数据仓库系统V2.0 数据仓库-数据集市-BI-数据分析 数据仓库...

    ETL-数据集成开发规范

    ETL是数据仓库系统中用于将分散、异构的数据源抽取出来,经过清洗、转换后加载到目标数据仓库的过程。它涵盖了数据的提取、转换和加载三个核心步骤。 3 开发ETL需要的背景知识: 在进行ETL开发前,开发者应具备以下...

    支持国产ETL etl-engine 用go写的轻量级etl引擎 方便集成到各企业中

    【etl-engine】是一款由国内开发者使用Go语言编写的轻量级ETL(Extract, Transform, Load)引擎,旨在帮助用户快速构建ETL解决方案,降低集成到现有项目或产品生态中的技术门槛。它包含了三个主要组件:etl-engine...

    ETL构建数据仓库

    #### 三、ETL构建企业级数据仓库的五步法 **步骤一:确定主题** - **定义**:根据业务需求,明确需要分析的主题,例如销售分析、客户行为分析等。 - **重要性**:主题的确定直接决定了数据仓库的构建方向,以及后续...

    数据仓库(DW)-初阶

    数据仓库(DW)是信息技术领域中的一个重要概念,主要用于企业数据管理和分析。对于初学者来说,理解数据仓库的基本原理、架构和应用是至关重要的。本文将深入探讨数据仓库的基础知识,帮助初入行的朋友建立起对这一...

    Python库 | criteria-etl-1.0a3.tar.gz

    在大数据时代,ETL过程常用于将来自不同来源的数据统一整理并存储到一个集中式的数据库或数据仓库中,以便于分析和决策。 `criteria-etl`库则是Python环境下实现ETL功能的一个框架。它提供了一种灵活的方式来定义...

    PyPI 官网下载 | lime-etl-0.1.27.tar.gz

    4. 数据加载:将处理后的数据加载到目标系统,如数据库、数据仓库或大数据平台。 对于`.tar.gz`格式的压缩包,通常需要先解压再安装。在Python环境中,可以使用`pip`工具,通过命令`pip install lime-etl-0.1.27....

    数据仓库ETL算法详解

    是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去; 2. 常用的ETL工具:主要有三大主流工具,分别是Ascential公司的Datastage...

    Python库 | unihan-etl-0.9.0.tar.gz

    而unihan-etl库则为开发者提供了一种方便的方法,用于提取、转换和加载这些数据,使其能够在数据仓库中进行分析和处理。 unihan-etl-0.9.0版本是该库的一个特定发行版,包含了库的最新特性和改进。它提供了一系列的...

    深入理解+Amazon+Athena+-+基于无服务器架构的大数据分析引擎

    #### 无服务器交互式数据查询引擎 Athena 的核心特性之一是其无服务器架构,这意味着用户无需担心服务器的配置、维护或扩展问题。这种架构提供了以下优势: - **零基础设施管理**:用户不需要管理任何物理或虚拟...

Global site tag (gtag.js) - Google Analytics