`
fishermen
  • 浏览: 380003 次
社区版块
存档分类
最新评论

数据仓库是什么?

阅读更多


包含运作数据(运行业务日常交易的数据)的系统包含了业务分析员可用来更好地理解业务是如何运作的信息。例如,他们可以看到一年中的哪些时候在哪些地区销售了哪些产品。这有助于识别异常情况,或者规划未来的销售。

但是,如果分析员直接访问运作数据,那么会产生几个问题:

他们可能没有查询运作数据库的专门知识。例如,查询 IMS 数据库需要一个使用专门类型的数据操作语言的应用程序。一般而言,那些拥有查询运作数据库专门技术的程序员都全职维护数据库及其应用程序。

性能对于许多运作数据库(例如银行的数据库)是关键。系统无法处理用户对运作数据存储所进行的“特别的”查询。想象一下您正在因特网上处理您的银行业务并支付帐单。当您按下 OK 按钮时,处理付款通常只要几秒钟。现在,请考虑银行分析员正在设法搞清楚如何从现有的客户群赚取更多的钱。该分析员运行了一个查询,它非常复杂,以致于现在完成您的事务要花大约 30 秒时间。很显然,这个性能时间是不能接受的(而且分析员所幻想的新费用也是不可能的)。由于这个原因,一般将运作数据存储和报告数据存储(包括 OLAP 数据库)分开。

但是,在近几年中,报告数据存储已经逐渐成为伪操作(pseudo-operational)数据存储而且很流行。这样的存储称为操作数据存储(operation data store)(ODS)。例如,请考虑电信业。ODS 在这些公司中很流行,因为它们尽可能快地设法识别欺骗性的费用。DB2 是非常适合于运作和报告工作负载的少数几个数据库之一。

运作数据通常并不是业务分析员使用的最佳格式。例如,对于分析员来说,根据产品、地区和季节而汇总的销售数据比原始数据有用得多。

数据仓库解决了这些问题。在数据仓库中,您创建信息化的数据(informational data)(该数据抽取自运作数据,随后对其进行转换和清理,以用于最终用户的决策)存储。例如,数据仓库工具可能会复制运作数据库中的所有销售数据、执行计算以汇总数据以及将汇总好的数据写到与运作数据分开的数据库。最终用户可以查询这个分开的数据库(数据仓库),而不会影响运作数据库。
分享到:
评论

相关推荐

    湖仓一体:数据湖vs数据仓库之争?.doc

    湖仓一体:数据湖vs数据仓库之争? 一、数据湖和数据仓库的差异 数据湖和数据仓库是两个不同的概念,它们之间的差异是很多人所关心的热点话题。数据仓库是一个存储和管理数据的平台,通过对数据的整合和分析,帮助...

    数据仓库概念、设计和介绍

    数据仓库是一种专为数据分析和决策支持服务的系统,它与传统的事务处理系统有着显著的区别。在事务处理系统中,数据是实时更新的,注重高效快速地处理单个事务,而在数据仓库环境中,数据是静态的,主要用于数据分析...

    湖仓一体:数据湖vs数据仓库之争? (2).docx

    【湖仓一体:数据湖vs数据仓库之争?】 在大数据领域的发展历程中,数据仓库和数据湖的概念一直是讨论的焦点。数据仓库自20世纪90年代起,作为企业数据管理的重要工具,专注于结构化的数据分析,而数据湖则是近年来...

    简论数据仓库和数据挖掘的内在关系

    数据仓库与数据挖掘是两个密切相关的概念,在现代计算机应用技术中具有十分重要的地位。要深入理解这两者的内在关系,首先需要明确它们各自的定义和作用。 数据仓库是一个面向主题的、集成的、稳定的且随时间变化的...

    湖仓一体:数据湖vs数据仓库之争?.docx

    【湖仓一体:数据湖vs数据仓库之争】的讨论源于大数据领域的发展变迁。数据仓库和数据湖是两种不同的数据管理方式,它们各自有着特定的优势和应用场景。数据仓库自20世纪90年代起,主要是为了支持企业决策分析,强调...

    数据仓库与数据挖掘(陈志泊)课后习题答案1

    数据仓库与数据挖掘是现代企业决策支持系统的关键组成部分。数据仓库是存储历史数据的系统,设计目的是为了支持决策分析,而数据挖掘则是从大量数据中发现有价值信息的过程。以下是这两个领域的核心概念及其特点: ...

    数据仓库,数据湖下一步是什么?.pdf

    数据仓库和数据湖是现代大数据处理的关键组成部分,但随着技术的发展和业务需求的变化,它们面临着新的挑战和机遇。本文将探讨在数据仓库和数据湖之后的下一步趋势。 首先,我们来理解一下数据仓库和数据湖的基本...

    数据仓库与数据挖掘课程设计.docx

    ### 数据仓库与数据挖掘课程设计知识点详解 #### 一、项目背景及提出问题 - **项目背景**: 在当前的大数据时代背景下,无论是哪个行业都需要对商品及其相关环节的数据进行有效的收集与处理。特别是零售行业,通过对...

    数据湖数据仓库湖仓一体建设解决方案技术资料合集(15份).zip

    20220824-数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼?.pdf 《湖仓集一体关键技术解读》-.pdf 出行基于湖仓一体构建数据中台的实践与思考.pdf 基于Flink+Iceberg构建企业级实时数据湖.pdf 基于...

    数据仓库与数据挖掘-实验报告 数据仓库的设计、实现及多维分析 共14页.pdf

    数据仓库与数据挖掘是现代信息技术领域中的重要组成部分,它们在数据驱动决策的背景下扮演着关键角色。本实验报告主要探讨了数据仓库的设计、实现及多维分析,涉及到的关键概念包括数据仓库、多维数据模型、ETL过程...

    数据仓库与数据挖掘课程实验

    ### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...

    数据仓库与数据挖掘(华电)

    数据仓库与数据挖掘是信息技术领域中的重要组成部分,尤其在当今大数据时代,这两个概念的重要性日益凸显。华北电力大学开设的这门研究生课程,由郑玲老师主讲,旨在深入讲解这两方面的理论与实践。 数据仓库(Data...

    数据仓库,数据仓库入门

    1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...

    数据治理及数据仓库模型设计.pdf

    在当今的信息时代,数据治理和数据仓库模型设计是企业管理和信息技术领域中的两个关键概念。随着大数据技术的快速发展,企业需要处理的数据量不断增加,数据治理和数据仓库模型设计成为了确保数据得到合理管理和高效...

    数据仓库的概念及特点

    ### 数据仓库的概念及特点 #### 一、数据仓库的定义及其关键组成部分 数据仓库是一种用于企业管理和决策支持的专用数据存储系统。它汇集了来自多种数据源的数据,并以一种有利于决策支持的方式进行组织。根据定义...

    数据仓库设计说明书

    1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...

    数据仓库与数据分析教程ppt.rar

    首先,我们要理解什么是数据仓库。数据仓库是一个专门为决策支持系统设计的集成化、非易失性的数据集合,它存储了组织历史上的数据,通常来自多个不同的源系统。数据仓库的目标是提供一个中心化的存储,使得分析人员...

    数据仓库数据湖数据中台建设详解-4.9

    全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、...

    《数据仓库与数据挖掘》课程设计方案报告模板.pdf

    数据仓库与数据挖掘是信息技术领域中的重要组成部分,尤其在大数据时代,它们的作用愈发显著。这份《数据仓库与数据挖掘》课程设计方案报告模板旨在为学生提供一个实践导向的学习框架,通过实际项目来理解并掌握这两...

    大数据中台、数据仓库、大数据平台、数据治理经验总结.rar

    3. **大数据之数据仓库**:深入理解大数据环境下的数据仓库建设,如Hadoop数据仓库(Hadoop Data Warehouse)的设计原则、架构优化和性能提升策略。 4. **数据仓库、大数据平台和数据中台三者之间的关系**:数据...

Global site tag (gtag.js) - Google Analytics