`

什么是数据仓库

 
阅读更多

摘自: 《Data Mining - Concepts and Techniques》 

 

According toWilliam H. Inmon, a leading architect in the construction of data warehouse

systems, “A data warehouse is a subject-oriented, integrated, time-variant, and

nonvolatile collection of data in support of management’s decision making process”

[Inm96]. This short, but comprehensive definition presents the major features of a data

warehouse. The four keywords, subject-oriented, integrated, time-variant, and nonvolatile,

distinguish data warehouses from other data repository systems, such as relational

database systems, transaction processing systems, and file systems. Let’s take a closer

look at each of these key features.

Subject-oriented: A data warehouse is organized around major subjects, such as customer, supplier, product, and sales.Rather than concentrating on the day-to-day operations and transaction processing of an organization, a data warehouse focuses on the modeling and analysis of data for decision makers. Hence, data warehouses typically provide a simple and concise view around particular subject issues by excluding data that are not useful in the decision support process.

Integrated: A data warehouse is usually constructed by integratingmultiple heterogeneous sources, such as relational databases, flat files, and on-line transaction records. Data cleaning and data integration techniques are applied to ensure consistency in naming conventions, encoding structures, attribute measures, and so on.

Time-variant: Data are stored to provide information from a historical perspective (e.g., the past 5–10 years). Every key structure in the data warehouse contains, either implicitly or explicitly, an element of time.

Nonvolatile: A data warehouse is always a physically separate store of data transformed from the application data found in the operational environment. Due to this separation, a data warehouse does not require transaction processing, recovery, and concurrency control mechanisms. It usually requires only two operations in data accessing: initial loading of data and access of data.

分享到:
评论

相关推荐

    数据仓库与数据分析教程ppt.rar

    首先,我们要理解什么是数据仓库。数据仓库是一个专门为决策支持系统设计的集成化、非易失性的数据集合,它存储了组织历史上的数据,通常来自多个不同的源系统。数据仓库的目标是提供一个中心化的存储,使得分析人员...

    数据仓库概述与应用数据仓库概述与应用数据仓库概述与应用

    ### 1.1 什么是数据仓库? 数据仓库是一种专门用于支持企业决策分析的大型数据存储库。它具有以下四个关键特性: - **面向主题**:数据仓库中的数据围绕特定的主题领域进行组织,如销售、客户关系、财务等,以便于...

    数据仓库的概念

    #### 一、什么是数据仓库 数据仓库是一种特殊类型的数据库,它主要用于支持决策制定过程,而非日常的事务处理。数据仓库的主要特点是面向主题、集成性、相对稳定性以及反映历史变化。 1. **面向主题**:数据仓库中...

    Oracle 数据仓库技术白皮书

    ##### 1.1 什么是数据仓库? 数据仓库是由William Inmon博士在90年代初提出的概念,他将其定义为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于支持管理决策...

    2021年企业级大数据项目之数据仓库(专业完整版).pdf

    什么是数据仓库 数据仓库(Data Warehouse)是指一个专门设计用来存储和管理企业级数据的系统,旨在支持商业智能应用,如数据分析、报表生成和数据 mining 等。数据仓库通常来自于各种来源,如数据库、文件、应用...

    数据仓库工程师面试题.docx

    什么是数据仓库? 数据仓库(Data Warehouse)是指一个大型的存储数据的集合,用于解决企业数据分析和决策目的。它将来自多个数据源的数据进行筛选、整合和指导业务流程改进、成本、质量和控制。 数据仓库的特点:...

    数据仓库与数据挖掘教程

    首先,我们来理解什么是数据仓库。数据仓库是一个集中的、结构化的存储系统,用于收集来自多个源的大量数据,并对其进行整合、清理和优化,以便于分析和报告。它的设计目的是支持决策制定过程,提供历史数据的长期...

    漫画:什么是数据仓库?.docx

    数据仓库是企业分析性报表和决策支持的重要工具,它将来自多个数据源的数据进行筛选与整合,从而为企业供应肯定的商业智能(BI)力量。 数据仓库是指一个很大的数据存储集合,用于企业的分析性报表和决策支持目的。...

    数据仓库数据仓库数据仓库

    主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。...

    韩家炜数据仓库ppt

    ### 一、什么是数据仓库(What is a data warehouse) 数据仓库是一种用于收集、管理和分析大量业务数据的信息系统。它通常用于支持商业智能活动,特别是分析性报告和决策支持。与传统数据库不同,数据仓库中的数据...

    WEB数据仓库--经典

    首先,我们需要理解什么是数据仓库。数据仓库是一个专门设计用于数据分析的系统,它收集、整合并存储来自不同源的数据,为决策制定提供支持。与常规数据库不同,数据仓库通常用于查询和报告,而不是事务处理。 在...

    数据仓库在零售行业中的应用

    首先,让我们来了解什么是数据仓库。数据仓库是一个面向目标的、综合的、随时间而变化的用以支持管理决策的数据集成。它通过将企业内的各种数据源整合起来,提供了一个统一的数据平台,支持企业的管理决策。 在零售...

    经典数据仓库(原书第三版)

    在数据仓库的世界里,首先我们要理解什么是数据仓库。数据仓库是一个用于报告和数据分析的系统,它集成了来自不同源的数据,并以一种对企业决策制定者友好的方式来组织。与操作型数据库不同,数据仓库更侧重于支持...

    数据仓库与联机分析处理技术

    **什么是数据仓库技术** 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策的信息处理。它的主要特点是面向主题、集成性、稳定性以及反映历史变化。 **数据仓库技术与相关...

    数据仓库电子书数据仓库电子书

    数据仓库是一种特定类型的信息系统,专门设计用于支持企业的决策制定过程。它收集、整合和存储来自企业多个操作系统的大量历史数据,以便进行分析和报告。数据仓库的主要目标是提供一致、稳定且易于理解的数据视图,...

    数据仓库与数据挖掘(陈志泊)课后习题答案1

    数据仓库与数据挖掘是现代企业决策支持系统的关键组成部分。数据仓库是存储历史数据的系统,设计目的是为了支持决策分析,而数据挖掘则是从大量数据中发现有价值信息的过程。以下是这两个领域的核心概念及其特点: ...

    数据仓库与数据挖掘课程实验

    ### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...

    数据仓库,数据仓库入门

    1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...

Global site tag (gtag.js) - Google Analytics