`

数据挖掘和OLAP的简单理解

阅读更多
OLAP是决策支持领域的一部分。传统的查询和报表工具是告诉你数据库中都有
什么(what happened),OLAP则更进一步告诉你下一步会怎么样(What next)、
和如果我采取这样的措施又会怎么样(What if)。用户首先建立一个假设,然
后用OLAP检索数据库来验证这个假设是否正确。比如,一个分析师想找到什么
原因导致了贷款拖欠,他可能先做一个初始的假定,认为低收入的人信用度也
低,然后用OLAP来验证他这个假设。如果这个假设没有被证实,他可能去察看
那些高负债的账户,如果还不行,他也许要把收入和负债一起考虑,一直进行
下去,直到找到他想要的结果或放弃。
也就是说,OLAP分析师是建立一系列的假设,然后通过OLAP来证实或推翻这些
假设来最终得到自己的结论。OLAP分析过程在本质上是一个演绎推理的过程
但是如果分析的变量达到几十或上百个,那么再用OLAP手动分析验证这些假设
将是一件非常困难和痛苦的事情。
数据挖掘与OLAP不同的地方是,数据挖掘不是用于验证某个假定的模式(模型)
的正确性,而是在数据库中自己寻找模型。他在本质上是一个归纳的过程。比
如,一个用数据挖掘工具的分析师想找到引起贷款拖欠的风险因素。数据挖掘
工具可能帮他找到高负债和低收入是引起这个问题的因素,甚至还可能发现一
些分析师从来没有想过或试过的其他因素,比如年龄。
数据挖掘和OLAP具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,
你也许要验证一下如果采取这样的行动会给公司带来什么样的影响,那么OLAP
工具能回答你的这些问题。
而且在知识发现的早期阶段,OLAP工具还有其他一些用途。可以帮你探索数据,
找到哪些是对一个问题比较重要的变量,发现异常数据和互相影响的变量。这
都能帮你更好的理解你的数据,加快知识发现的过程。
分享到:
评论

相关推荐

    数据仓库和数据挖掘的OLAP技术.pptx

    数据仓库并不是对操作数据库的简单复制,而是根据业务需求进行了专门的构造和优化。W.H. Inmon给出的定义强调了其面向主题、集成、随时间变化和数据不易丢失的特性。面向主题意味着数据仓库是围绕业务的关键领域,如...

    第二章数据仓库和数据挖掘的OLAP技术.pptx

    数据仓库的数据可以分为详细型和汇总型,以及元数据,元数据是对数据仓库本身及其内容的描述,对理解和使用数据仓库至关重要。此外,多维数据模型(如数据立方体)提供了更高效的分析工具,支持快速的OLAP(在线分析...

    数据挖掘方面简单介绍

    数据挖掘的定义多种多样,如Groth认为它是从数据中发现隐藏模式的过程,Beryy和Linoff认为它是自动或半自动发现数据模式的过程,而Hand等人则强调数据挖掘是将复杂数据总结为易于理解的形式,以支持决策。...

    数据挖掘(概念与技术)课后习题答案

    - 数据挖掘不仅仅是一次简单的技术转变,它是数据库技术、统计学和机器学习等多个学科技术的综合应用。尽管数据挖掘依赖于这些领域的理论和技术基础,但其目标和方法论已经超出了这些单一领域的范畴,形成了一门...

    数据挖掘面试题库

    面试题库中的内容涵盖了数据挖掘的多个关键知识点,包括数据预处理、数据仓库、OLAP(在线分析处理)、关联规则、决策树、神经网络、聚类分析等。 1. Web挖掘通常分为结构化挖掘、半结构化挖掘和非结构化挖掘,分别...

    数据挖掘概念与技术——简介

    总的来说,数据挖掘是将大数据转变为洞察力的关键工具,对于理解和利用现代社会中的海量信息至关重要。它不仅涉及技术层面,也涵盖了应用层面,如市场营销、风险管理等领域,为各类组织提供了有力的数据支持。

    数据仓库与数据挖掘的论文 Word格式的

    其结构主要由数据源、数据仓库、业务数据仓库、数据分析与报表、数据管理、元数据管理、传输和基础架构组成,其中数据管理负责数据的规范化、清洗和加载,而数据分析与报表则利用OLAP和数据挖掘工具提供信息提取和...

    数据挖掘算法数据挖掘算法

    OLAP通常用于多维数据分析,由用户控制,适合有限的维度和数据类型,而数据挖掘则能在无明确假设的情况下探索未知模式,发现更复杂的结构。 数据挖掘与统计学密切相关,许多数据挖掘算法源自统计学,但数据挖掘更加...

    数据仓库与数据挖掘个人复习

    数据仓库与数据挖掘个人复习 数据仓库与数据挖掘是两个紧密相连的概念,都是数据分析和知识发现的重要组成...这些知识点都是数据分析和知识发现的重要组成部分,能够帮助我们更好地理解和应用数据仓库和数据挖掘技术。

    大数据分析与大数据挖掘课程 数据仓库与数据挖掘教程 第5章 数据挖掘基础 共46页.pptx

    数据挖掘不仅仅是简单的数据筛选或统计分析,它涉及到多个学科的交叉,如数据库系统、统计学、机器学习、可视化和信息科学。其中,机器学习是数据挖掘的核心技术之一,通过学习数据中的模式,可以对未知数据进行预测...

    四川大学软件硕士数据挖掘概念与技术完全课件

    数据挖掘不仅仅是简单的数据收集,而是通过对海量数据的分析,提取出模式、规律和趋势,从而为决策提供依据。这通常包括分类、聚类、关联规则学习、序列模式挖掘和异常检测等多种方法。 分类是数据挖掘的一种基本...

    数据挖掘:概念与技术(韩家炜等)中文版

    同时,确保挖掘结果易于理解和应用也是研究者关注的重点。 ### 第二章 数据仓库和数据挖掘的OLAP技术 #### 2.1 什么是数据仓库? 数据仓库是一种专为数据分析和报告设计的数据库架构,它将历史数据和当前数据整合...

    好书推荐之:数据挖掘原理与算法.pdf

    第6章还简单介绍了数据可视化的内容,作为数据挖掘的一个重要组成部分,数据可视化有助于更好地理解数据挖掘结果。 最后一章,即第9章,介绍了开放的数据挖掘平台。作者在这一章中分享了开发数据仓库产品及数据挖掘...

    基于SQL Server 2005的数据挖掘系统应用研究.pdf

    通过以上内容,我们能够了解到数据挖掘系统的应用研究、数据挖掘软件的发展趋势、SQL Server 2005的数据挖掘功能分析,以及数据挖掘在商业智能和OLAP中的应用。这为希望深入理解数据挖掘技术、特别是SQL Server 2005...

    数据仓库、OLAP和数据挖掘、统计分析的关系和区别分析

    数据挖掘(DataMining),又称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或...

    广东工业大学11年数据挖掘复习资料

    5. **案例研究**:通过实际案例,比如市场篮子分析、客户细分、信用评估等,来加深对数据挖掘的理解和应用。 6. **评价指标**:学习如何使用准确率、召回率、F1分数、ROC曲线等评价模型的性能。 7. **工具与平台**...

Global site tag (gtag.js) - Google Analytics