`

数据挖掘和OLAP的简单理解

阅读更多
OLAP是决策支持领域的一部分。传统的查询和报表工具是告诉你数据库中都有
什么(what happened),OLAP则更进一步告诉你下一步会怎么样(What next)、
和如果我采取这样的措施又会怎么样(What if)。用户首先建立一个假设,然
后用OLAP检索数据库来验证这个假设是否正确。比如,一个分析师想找到什么
原因导致了贷款拖欠,他可能先做一个初始的假定,认为低收入的人信用度也
低,然后用OLAP来验证他这个假设。如果这个假设没有被证实,他可能去察看
那些高负债的账户,如果还不行,他也许要把收入和负债一起考虑,一直进行
下去,直到找到他想要的结果或放弃。
也就是说,OLAP分析师是建立一系列的假设,然后通过OLAP来证实或推翻这些
假设来最终得到自己的结论。OLAP分析过程在本质上是一个演绎推理的过程
但是如果分析的变量达到几十或上百个,那么再用OLAP手动分析验证这些假设
将是一件非常困难和痛苦的事情。
数据挖掘与OLAP不同的地方是,数据挖掘不是用于验证某个假定的模式(模型)
的正确性,而是在数据库中自己寻找模型。他在本质上是一个归纳的过程。比
如,一个用数据挖掘工具的分析师想找到引起贷款拖欠的风险因素。数据挖掘
工具可能帮他找到高负债和低收入是引起这个问题的因素,甚至还可能发现一
些分析师从来没有想过或试过的其他因素,比如年龄。
数据挖掘和OLAP具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,
你也许要验证一下如果采取这样的行动会给公司带来什么样的影响,那么OLAP
工具能回答你的这些问题。
而且在知识发现的早期阶段,OLAP工具还有其他一些用途。可以帮你探索数据,
找到哪些是对一个问题比较重要的变量,发现异常数据和互相影响的变量。这
都能帮你更好的理解你的数据,加快知识发现的过程。
分享到:
评论

相关推荐

    数据仓库和数据挖掘的OLAP技术.pptx

    数据仓库并不是对操作数据库的简单复制,而是根据业务需求进行了专门的构造和优化。W.H. Inmon给出的定义强调了其面向主题、集成、随时间变化和数据不易丢失的特性。面向主题意味着数据仓库是围绕业务的关键领域,如...

    第二章数据仓库和数据挖掘的OLAP技术.pptx

    数据仓库的数据可以分为详细型和汇总型,以及元数据,元数据是对数据仓库本身及其内容的描述,对理解和使用数据仓库至关重要。此外,多维数据模型(如数据立方体)提供了更高效的分析工具,支持快速的OLAP(在线分析...

    数据挖掘方面简单介绍

    数据挖掘的定义多种多样,如Groth认为它是从数据中发现隐藏模式的过程,Beryy和Linoff认为它是自动或半自动发现数据模式的过程,而Hand等人则强调数据挖掘是将复杂数据总结为易于理解的形式,以支持决策。...

    数据挖掘(概念与技术)课后习题答案

    - 数据挖掘不仅仅是一次简单的技术转变,它是数据库技术、统计学和机器学习等多个学科技术的综合应用。尽管数据挖掘依赖于这些领域的理论和技术基础,但其目标和方法论已经超出了这些单一领域的范畴,形成了一门...

    数据挖掘面试题库

    面试题库中的内容涵盖了数据挖掘的多个关键知识点,包括数据预处理、数据仓库、OLAP(在线分析处理)、关联规则、决策树、神经网络、聚类分析等。 1. Web挖掘通常分为结构化挖掘、半结构化挖掘和非结构化挖掘,分别...

    数据挖掘概念与技术——简介

    总的来说,数据挖掘是将大数据转变为洞察力的关键工具,对于理解和利用现代社会中的海量信息至关重要。它不仅涉及技术层面,也涵盖了应用层面,如市场营销、风险管理等领域,为各类组织提供了有力的数据支持。

    数据仓库与数据挖掘个人复习

    数据仓库与数据挖掘个人复习 数据仓库与数据挖掘是两个紧密相连的概念,都是数据分析和知识发现的重要组成...这些知识点都是数据分析和知识发现的重要组成部分,能够帮助我们更好地理解和应用数据仓库和数据挖掘技术。

    大数据分析与大数据挖掘课程 数据仓库与数据挖掘教程 第5章 数据挖掘基础 共46页.pptx

    数据挖掘不仅仅是简单的数据筛选或统计分析,它涉及到多个学科的交叉,如数据库系统、统计学、机器学习、可视化和信息科学。其中,机器学习是数据挖掘的核心技术之一,通过学习数据中的模式,可以对未知数据进行预测...

    四川大学软件硕士数据挖掘概念与技术完全课件

    数据挖掘不仅仅是简单的数据收集,而是通过对海量数据的分析,提取出模式、规律和趋势,从而为决策提供依据。这通常包括分类、聚类、关联规则学习、序列模式挖掘和异常检测等多种方法。 分类是数据挖掘的一种基本...

    数据挖掘:概念与技术(韩家炜等)中文版

    同时,确保挖掘结果易于理解和应用也是研究者关注的重点。 ### 第二章 数据仓库和数据挖掘的OLAP技术 #### 2.1 什么是数据仓库? 数据仓库是一种专为数据分析和报告设计的数据库架构,它将历史数据和当前数据整合...

    好书推荐之:数据挖掘原理与算法.pdf

    第6章还简单介绍了数据可视化的内容,作为数据挖掘的一个重要组成部分,数据可视化有助于更好地理解数据挖掘结果。 最后一章,即第9章,介绍了开放的数据挖掘平台。作者在这一章中分享了开发数据仓库产品及数据挖掘...

    基于SQL Server 2005的数据挖掘系统应用研究.pdf

    通过以上内容,我们能够了解到数据挖掘系统的应用研究、数据挖掘软件的发展趋势、SQL Server 2005的数据挖掘功能分析,以及数据挖掘在商业智能和OLAP中的应用。这为希望深入理解数据挖掘技术、特别是SQL Server 2005...

    数据仓库、OLAP和数据挖掘、统计分析的关系和区别分析

    数据挖掘(DataMining),又称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或...

    广东工业大学11年数据挖掘复习资料

    5. **案例研究**:通过实际案例,比如市场篮子分析、客户细分、信用评估等,来加深对数据挖掘的理解和应用。 6. **评价指标**:学习如何使用准确率、召回率、F1分数、ROC曲线等评价模型的性能。 7. **工具与平台**...

    数据挖掘商业计划书

    数据挖掘商业计划书的核心是构建一个能够从海量数据中提取有价值信息和知识的系统,以帮助企业做出更明智的决策。简单数据挖掘团队专注于这个领域,已经开发出了一个演示版本的软件,目标是进一步完善功能,使其更...

Global site tag (gtag.js) - Google Analytics