`
- 浏览:
621516 次
- 性别:
- 来自:
上海
-
问:数据仓库有什么特别的地方?
答:没什么特别,跟普通关系数据库没什么两样.
问:啊,那有什么特别?
答:数据仓库本身物理上也是关系数据库,只是数据仓库系统是一个体系,一个过程.数据仓库技术要解决的问题是如何建立,管理,维护运行一个数据仓库.
问:数据仓库跟普通数据库存储的数据不一样?
答:数据仓库面向分析,普通业务数据库面向交易,我们公司产品就是业务数据库.面向分析的数据库重点在查询,业务数据库重点在修改更新.
问:数据仓库就是把业务数据库的数据抽出来建立新的数据库,专门供分析查询用?
答:可以这么说,不过不是简单的抽取,因为两者的应用不同,所依赖的数据模型不同,数据仓库主要采用多维模型,而业务数据库采用关系模型。所以,抽取的过程是一次模型的转换,从关系模型转换为多维模型,这个过程业界成为ETL,除了转换外,还要考虑数据集成,清洗等。
问:可是你不是说数据仓库物理上也是关系模型,怎么表示多维模型?
答:业界用称为星型结构的多个表来表示多维模型,多个维表围绕在事实表转,其中事实表表示数据,维表表示维度。多维模型也成Cube,立方体,边是维度,格子是发生数据。
问:那OLAP是什么,数据仓库不就是OLAP吗?
答:OLAP是联机分析处理的意思,OLAP是一本技术,它的产品分为服务器和前端产品,OLAP服务器也叫做多维数据库,数据仓库跟OLAP的关系,就像父亲和孩子的关系,广义的数据仓库包含OLAP,有些产商把两者混起来。但是,实际上数据仓库可以脱离OLAP存在,不供OLAP使用。这个比较复杂,很难一下说清楚。
问: 再说说嘛。
答: 其实,OLAP技术是数据仓库的一种应用,OLAP一般基于数据仓库,也就是说,OLAP服务器中的多维数据,也是从数据仓库中来的。OLAP一般位为数据仓库之上,olap的作用是为前端报表或控件提供直观的易于分析的多维数据,是数据与信息之间的一种桥梁。
问: OLAP还是挺神奇的,它到底能干什么?
答: OLAP技术其实定义了一些逻辑模型,包括结构模型和行为模型,结构模型即维度、Cube模型,把现实的数据以多维的形式来表达,有利于分析。为什么有利于分析呢,行为模型就是定义在结构模型之上的分析行为,包括维度自由组合、旋转、钻取等等,而这些行为是比较直观的,符合人脑的思维习惯。
问: 等等,钻取是什么,好像很熟,是数据挖掘吗?
答: 晕,数据挖掘跟这不搭边的,等下再说。钻取是从高粒度的数据钻到低粒度的数据中,比如从广东省的汇总数据钻到各个城市的数据。这在以前的报表工具中是很难实现的。
问: 怎么做到钻取?
答: 其实,维度不是线性的,而是一颗树,术语叫“带有层级关系的维度”,这个层级关系就定义了父子关系,钻取路径。
问: 哦,还是晕,那我们自己的OLAP工具在做什么。
答: 我们自己的OLAP工具有别于国外产商,我们没有存储,也就是没有OLAP服务器的概念。我们有OLAP前端和OLAP服务引擎,服务引擎直接从业务数据库或者数据仓库中抽取数据生成Cube模型的数据,OLAP前端组件比如表格和图形,将Cube模型的数据表现出来,并提供分析功能。也就是说,我们的OLAP定义了一套OLAP模型,就是上面说的结构模型和行为模型,服务引擎负责把关系模型的数据转换为多维模型,并提供了OLAP分析行为借口,前端能够识别这个OLAP模型。其实,OLAP技术只是定义了一些模型,并未定义如何实现,每个专业产商都有自己的实现和理念。有些产商的产品根本就没有OLAP产品,它也能实现OLAP分析功能。
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
首先,我们要理解什么是数据仓库。数据仓库是一个专门为决策支持系统设计的集成化、非易失性的数据集合,它存储了组织历史上的数据,通常来自多个不同的源系统。数据仓库的目标是提供一个中心化的存储,使得分析人员...
#### 一、什么是数据仓库 数据仓库是一种特殊类型的数据库,它主要用于支持决策制定过程,而非日常的事务处理。数据仓库的主要特点是面向主题、集成性、相对稳定性以及反映历史变化。 1. **面向主题**:数据仓库中...
##### 1.1 什么是数据仓库? 数据仓库是由William Inmon博士在90年代初提出的概念,他将其定义为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于支持管理决策...
什么是数据仓库 数据仓库(Data Warehouse)是指一个专门设计用来存储和管理企业级数据的系统,旨在支持商业智能应用,如数据分析、报表生成和数据 mining 等。数据仓库通常来自于各种来源,如数据库、文件、应用...
什么是数据仓库? 数据仓库(Data Warehouse)是指一个大型的存储数据的集合,用于解决企业数据分析和决策目的。它将来自多个数据源的数据进行筛选、整合和指导业务流程改进、成本、质量和控制。 数据仓库的特点:...
首先,我们来理解什么是数据仓库。数据仓库是一个集中的、结构化的存储系统,用于收集来自多个源的大量数据,并对其进行整合、清理和优化,以便于分析和报告。它的设计目的是支持决策制定过程,提供历史数据的长期...
数据仓库是企业分析性报表和决策支持的重要工具,它将来自多个数据源的数据进行筛选与整合,从而为企业供应肯定的商业智能(BI)力量。 数据仓库是指一个很大的数据存储集合,用于企业的分析性报表和决策支持目的。...
### 一、什么是数据仓库(What is a data warehouse) 数据仓库是一种用于收集、管理和分析大量业务数据的信息系统。它通常用于支持商业智能活动,特别是分析性报告和决策支持。与传统数据库不同,数据仓库中的数据...
首先,我们需要理解什么是数据仓库。数据仓库是一个专门设计用于数据分析的系统,它收集、整合并存储来自不同源的数据,为决策制定提供支持。与常规数据库不同,数据仓库通常用于查询和报告,而不是事务处理。 在...
首先,让我们来了解什么是数据仓库。数据仓库是一个面向目标的、综合的、随时间而变化的用以支持管理决策的数据集成。它通过将企业内的各种数据源整合起来,提供了一个统一的数据平台,支持企业的管理决策。 在零售...
在数据仓库的世界里,首先我们要理解什么是数据仓库。数据仓库是一个用于报告和数据分析的系统,它集成了来自不同源的数据,并以一种对企业决策制定者友好的方式来组织。与操作型数据库不同,数据仓库更侧重于支持...
**什么是数据仓库技术** 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策的信息处理。它的主要特点是面向主题、集成性、稳定性以及反映历史变化。 **数据仓库技术与相关...
数据仓库与数据挖掘是现代企业决策支持系统的关键组成部分。数据仓库是存储历史数据的系统,设计目的是为了支持决策分析,而数据挖掘则是从大量数据中发现有价值信息的过程。以下是这两个领域的核心概念及其特点: ...
### 数据仓库与数据挖掘课程实验知识点解析 #### 一、数据仓库基础知识 **1.1 数据仓库的概念** 数据仓库是一种用于存储和管理大量历史数据的系统,主要用于支持业务决策过程。它通过收集、整理和组织来自不同源...
1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...
数据仓库与数据挖掘是现代信息技术领域中的重要组成部分,它们在数据驱动决策的背景下扮演着关键角色。本实验报告主要探讨了数据仓库的设计、实现及多维分析,涉及到的关键概念包括数据仓库、多维数据模型、ETL过程...
IBM数据仓库需求建模方法及行业数据仓库模型的知识点主要涵盖了数据仓库的建设、企业级数据仓库建模、软硬件配置、行业数据仓库模型以及市场趋势和相关技术。 首先,IBM数据仓库需求建模方法强调了企业级数据仓库...
#### 什么是数据仓库 数据仓库是一种集成的、面向主题的数据集合,其主要目的是支持决策制定而非日常运营。数据仓库通常包含从各种来源抽取、清理、转换并加载到特定格式的数据,以便于进行分析和报告。具体而言,...