`
cyzhang999
  • 浏览: 26766 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

分析报告、统计分析和数据挖掘的区别(转)

阅读更多
做数据挖掘,惊喜发现做了一堆统计分析。 这还是数据挖掘吗? 真的不是。所以转这篇博客看一下。 http://spss-market.r.blog.163.com/blog/static/7314226820114180022131/?suggestedreading
#############################################################


关于数据挖掘的作用,Berry and Linoff的定义尽管有些言过其实,但清晰的描述了数据挖掘的作用。“分析报告给你后见之明 (hindsight);统计分析给你先机 (foresight);数据挖掘给你洞察力 (insight)”。

    举个例子说。

    你看到孙悟空跟二郎神打仗,然后写了个分析报告,说孙悟空在柔韧性上优势明显,二郎神在力气上出类拔萃,所以刚开始不相上下;结果两个人跑到竹林里,在竹子上面打,孙悟空的优势发挥出来,所以孙悟空赢了。这叫分析报告。

   孙悟空要跟二郎神打架了,有个赌徒找你预测。你做了个统计,发现两人斗争4567次,其中孙悟空赢3456次。另外,孙悟空斗牛魔王,胜率是89%,二郎神斗牛魔王胜率是71%。你得出趋势是孙悟空赢。因为你假设了这次胜利跟历史的关系,根据经验作了一个假设。这叫统计分析。

   你什么都没做,让计算机自己做关联分析,自动找到了出身、教育、经验、单身四个因素。得出结论是孙悟空赢。计算机通过分析发现贫苦出身的孩子一般比皇亲国戚功夫练得刻苦;打架经验丰富的人因为擅长利用环境而机会更多;在都遇得到明师的情况下,贫苦出身的孩子功夫可能会高些;单身的人功夫总比同样环境非单身的高。孙悟空遇到的名师不亚于二郎神,而打架经验绝对丰富,并且单身,所以这次打头,孙悟空赢。这叫数据挖掘。

数据挖掘跟LOAP的区别在于它没有假设,让计算机找出这种背后的关系,而这种关系可能是你所想得到的,也可能是所想不到的。比如数据挖掘找出的结果发现在2亿条打斗记录中,姓孙的跟姓杨的打,总是姓孙的胜利,孙悟空姓孙,所以,悟空胜利。

用在现实中,我们举个例子来说,做OLAP分析,我们找找哪些人总是不及时向电信运营商缴钱,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时缴钱的穷人占71%。而数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。
分享到:
评论

相关推荐

    数据挖掘与数据分析.pdf

    R语言则以其强大的数据可视化和统计分析功能受到青睐,Java则因其广泛支持和高效性能被用于大规模项目,Scala则与大数据处理平台Spark紧密相连。而数据分析则更多地依赖于像SAS、SPSS这样的商业分析软件。 在行业...

    数据分析与数据挖掘.pdf

    1. 数据分析(Data Analysis)是为了提取有用信息和形成结论,通过适当的统计分析方法对收集来的大量数据进行分析,以理解和消化数据集的过程。 2. 数据挖掘(Data Mining)是利用算法从大量数据中搜索隐藏的信息,...

    1spss统计分析与数据挖掘.zip

    《1spss统计分析与数据挖掘》是一份深入讲解SPSS在统计分析和数据挖掘领域应用的资源包。SPSS,全称为Statistical Product and Service Solutions,是一款强大的统计分析软件,广泛应用于社会科学、市场研究、健康...

    统计分析与数据挖掘实战案例.pdf

    统计分析与数据挖掘实战案例.pdf 给有需要的朋友

    《数据仓库与数据挖掘》课程设计方案报告模板.pdf

    总结来说,这个课程设计方案报告通过实际案例,让学生深入理解和应用数据仓库的构建、OLAP分析以及数据挖掘技术,旨在培养他们在数据分析和决策支持方面的能力,为他们未来在人工智能领域的职业发展奠定坚实基础。

    完整版 北京大学 数据挖掘与数据分析教程 数据挖掘概念与技术 共88页.ppt

    北京大学的这门数据挖掘与数据分析教程深入讲解了这个领域的核心概念和技术。 首先,数据挖掘的目标是揭示隐藏在大量数据背后的模式、趋势和规律,从而帮助用户做出更明智的决策。它包括数据清理、数据集成、数据...

    SAS统计分析与数据挖掘

    《SAS统计分析与数据挖掘》是一本深入探讨SAS软件在统计分析和数据挖掘领域应用的专业书籍。SAS(Statistical Analysis System)是全球领先的商业智能和数据分析平台,广泛应用于科研、教育、金融、医药卫生等多个...

    数据挖掘实验报告与案例分析

    数据挖掘是一种从海量数据中提取有价值信息的过程,它利用各种算法和统计方法揭示隐藏在数据中的模式、关联和规律。本实验报告基于SQL Server 2005,深入探讨了数据挖掘的关键技术,包括决策树、时序分析、关联规则...

    统计行业数据分析与数据挖掘应用——工具篇.pdf

    而SPSS Statistics在易用性和快速分析上具有优势,适合于统计分析的初学者或者对数据挖掘要求不是很高的场景。建立一个真正适合中国统计行业的大数据平台,不仅能实现行业独立自主,还能促进人才的培养和专业技能的...

    数据挖掘与统计分析.pdf

    数据挖掘与统计分析.pdf

    住院病案首页数据挖掘和统计分析服务医院管理的研究.pdf

    数据挖掘和统计分析在医疗领域有着广泛的应用前景,能够帮助医院管理层做出更加科学和精准的决策。 数据挖掘技术,又称为资料探勘,是通过一系列的算法从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中...

    数据挖掘实验报告-数据预处理.pdf

    在数据挖掘过程中,数据预处理是至关重要的一步,因为它直接影响到后续分析和挖掘结果的准确性和可靠性。本实验报告主要关注数据预处理中的数据平滑技术,包括均值平滑、中值平滑和边界值平滑,这些都是降低噪声、...

    1885字看懂机器学习、数据挖掘、数据分析和统计分析之间的联系与区别.docx

    机器学习、数据挖掘、数据分析和统计分析之间的联系与区别 机器学习是一门人工智能科学,研究如何在经验学习中改善具体算法的性能。机器学习的核心是通过算法来学习和提取数据中的隐含规律,随着数据丰富程度和学习...

    使用统计分析和数据挖掘解决商务问题

    ### 使用统计分析和数据挖掘解决商务问题的知识点详解 #### 一、统计分析与数据挖掘在商务领域的应用 - **统计分析**:一种基于数学原理和技术的方法,用于收集、处理、解释数据,以便从中提取有价值的信息。在...

    浅谈数据挖掘中概率论与数理统计的应用.pdf

    在数据分析领域,数据挖掘是一门综合性的科学,它的目的和手段在于从大量复杂且具有不完全、离散特征的数据集中提取出有意义的、新颖的、具有统一特征且有用的模式或信息。数据挖掘的过程中,会涉及到多种技术的应用...

    基于R的统计分析与数据挖掘.pptx

    总的来说,R提供了强大的统计分析和数据挖掘能力,它的灵活性和开源性质使其成为学术界和工业界数据科学领域广泛采用的工具。通过学习和熟练运用R,你可以高效地进行数据探索、建模和可视化,从而更好地理解和解释...

    《基于R的统计分析与数据挖掘》数据和代码_rar_R语言_

    对R语言的一些功能的介绍,以及一些代码与数据类型和操作步骤

    统计行业数据分析与数据挖掘应用——工具篇 (1).pdf

    这些工具大部分都支持数据挖掘和统计分析,具备强大的数据处理能力和高质量的图形输出。 数据展示层工具主要是将数据以直观的形式呈现出来,如SAP的水晶易表、tableau、IBM的Cognos等。这些工具能够将复杂的数据...

    Python金融数据挖掘案例分析zip

    在本案例中,"Python金融数据挖掘案例分析zip"是一个以Python编程语言为基础的数据挖掘项目,专注于北京市的二手房市场。这个项目旨在通过收集、清洗、分析和可视化数据,揭示出北京市二手房市场的各种趋势和特征。...

    MATLAB数据分析与挖掘实战_matlab_matlab数据挖掘_数据挖掘matlab_数据挖掘_

    本书结合实例,详细介绍了MATLAB在数据挖掘领域的强大功能和实用技巧。 MATLAB是一种广泛应用于工程计算、科学计算以及数据分析的专业软件,其强大的数值计算能力使其在数据处理方面有着独特的优势。通过MATLAB,...

Global site tag (gtag.js) - Google Analytics