摘自: 《Data Mining - Concepts and Techniques》
According toWilliam H. Inmon, a leading architect in the construction of data warehouse
systems, “A data warehouse is a subject-oriented, integrated, time-variant, and
nonvolatile collection of data in support of management’s decision making process”
[Inm96]. This short, but comprehensive definition presents the major features of a data
warehouse. The four keywords, subject-oriented, integrated, time-variant, and nonvolatile,
distinguish data warehouses from other data repository systems, such as relational
database systems, transaction processing systems, and file systems. Let’s take a closer
look at each of these key features.
Subject-oriented: A data warehouse is organized around major subjects, such as customer,
supplier, product, and sales.Rather than concentrating on the day-to-day operations
and transaction processing of an organization, a data warehouse focuses on the
modeling and analysis of data for decision makers. Hence, data warehouses typically
provide a simple and concise view around particular subject issues by excluding data
that are not useful in the decision support process.
Integrated: A data warehouse is usually constructed by integratingmultiple heterogeneous
sources, such as relational databases, flat files, and on-line transaction records.
Data cleaning and data integration techniques are applied to ensure consistency in
naming conventions, encoding structures, attribute measures, and so on.
Time-variant: Data are stored to provide information from a historical perspective
(e.g., the past 5–10 years). Every key structure in the data warehouse contains, either
implicitly or explicitly, an element of time.
Nonvolatile: A data warehouse is always a physically separate store of data transformed
from the application data found in the operational environment. Due to
this separation, a data warehouse does not require transaction processing, recovery,
and concurrency control mechanisms. It usually requires only two operations in data
accessing: initial loading of data and access of data.
分享到:
相关推荐
首先,我们要理解什么是数据仓库。数据仓库是一个专门为决策支持系统设计的集成化、非易失性的数据集合,它存储了组织历史上的数据,通常来自多个不同的源系统。数据仓库的目标是提供一个中心化的存储,使得分析人员...
### 1.1 什么是数据仓库? 数据仓库是一种专门用于支持企业决策分析的大型数据存储库。它具有以下四个关键特性: - **面向主题**:数据仓库中的数据围绕特定的主题领域进行组织,如销售、客户关系、财务等,以便于...
#### 一、什么是数据仓库 数据仓库是一种特殊类型的数据库,它主要用于支持决策制定过程,而非日常的事务处理。数据仓库的主要特点是面向主题、集成性、相对稳定性以及反映历史变化。 1. **面向主题**:数据仓库中...
##### 1.1 什么是数据仓库? 数据仓库是由William Inmon博士在90年代初提出的概念,他将其定义为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于支持管理决策...
什么是数据仓库 数据仓库(Data Warehouse)是指一个专门设计用来存储和管理企业级数据的系统,旨在支持商业智能应用,如数据分析、报表生成和数据 mining 等。数据仓库通常来自于各种来源,如数据库、文件、应用...
什么是数据仓库? 数据仓库(Data Warehouse)是指一个大型的存储数据的集合,用于解决企业数据分析和决策目的。它将来自多个数据源的数据进行筛选、整合和指导业务流程改进、成本、质量和控制。 数据仓库的特点:...
首先,我们来理解什么是数据仓库。数据仓库是一个集中的、结构化的存储系统,用于收集来自多个源的大量数据,并对其进行整合、清理和优化,以便于分析和报告。它的设计目的是支持决策制定过程,提供历史数据的长期...
数据仓库是企业分析性报表和决策支持的重要工具,它将来自多个数据源的数据进行筛选与整合,从而为企业供应肯定的商业智能(BI)力量。 数据仓库是指一个很大的数据存储集合,用于企业的分析性报表和决策支持目的。...
主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。...
### 一、什么是数据仓库(What is a data warehouse) 数据仓库是一种用于收集、管理和分析大量业务数据的信息系统。它通常用于支持商业智能活动,特别是分析性报告和决策支持。与传统数据库不同,数据仓库中的数据...
首先,我们需要理解什么是数据仓库。数据仓库是一个专门设计用于数据分析的系统,它收集、整合并存储来自不同源的数据,为决策制定提供支持。与常规数据库不同,数据仓库通常用于查询和报告,而不是事务处理。 在...
首先,让我们来了解什么是数据仓库。数据仓库是一个面向目标的、综合的、随时间而变化的用以支持管理决策的数据集成。它通过将企业内的各种数据源整合起来,提供了一个统一的数据平台,支持企业的管理决策。 在零售...
在数据仓库的世界里,首先我们要理解什么是数据仓库。数据仓库是一个用于报告和数据分析的系统,它集成了来自不同源的数据,并以一种对企业决策制定者友好的方式来组织。与操作型数据库不同,数据仓库更侧重于支持...
**什么是数据仓库技术** 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策的信息处理。它的主要特点是面向主题、集成性、稳定性以及反映历史变化。 **数据仓库技术与相关...
数据仓库是一种特定类型的信息系统,专门设计用于支持企业的决策制定过程。它收集、整合和存储来自企业多个操作系统的大量历史数据,以便进行分析和报告。数据仓库的主要目标是提供一致、稳定且易于理解的数据视图,...
数据仓库与数据挖掘是现代企业决策支持系统的关键组成部分。数据仓库是存储历史数据的系统,设计目的是为了支持决策分析,而数据挖掘则是从大量数据中发现有价值信息的过程。以下是这两个领域的核心概念及其特点: ...
### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...
1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...