有很多初入商业智能的同学可能不明白数据分析和数据挖掘的区别在哪里,觉得他们做的事情都差不多,我亦如此!
经过这几年工作中和他们的合作和学习,大概清楚了他们的区别,今天看到一篇文章,系统的解释了下这两者的区别:
数据分析,是对数据的一种操作手段。或者算法。目标是针对先验的约束,对数据进行整理,筛选,加工。由此得到信息。
数据挖掘,是对数据分析手段后的信息,进行价值化的分析。
而数据分析和数据挖掘,又是甚至是递归的。就是数据分析的结果是信息,这些信息作为数据,由去数据挖掘。而数据挖掘,又使用了数据分析的手段。周而复始。。
这里再细化说一下。数据分析和数据挖掘的最大区别在于,数据分析,是以输入的数据为基础,通过先验的约束,对数据进行处理,但是不以结论何如为调 整。例如你需要图像识别,这个属于数据分析。你要分析人脸。数据通过你的先验的方法,就是出来个猫脸。你的数据分析也没有问题。你需要默默的承受结果,并 且尊重事实。因此数据分析的重点在于数据的有效性,真实性,和先验约束的正确性。
而数据挖掘则不同,数据挖掘是对信息的价值化的获取。价值化自然不考虑数据本身,而是考虑数据是否有价值。由此,一批数据,你尝试对它做不同的价值 评估,则就是数据挖掘。此时对比数据分析,最大的特点就是,你需要调整你的不同的先验约束,再次对数据进行分析。而先验的约束已经不是针对数据来源自身的 特点,例如信噪比处理算法。而是你期望得到的一个有价值的内容,做先验的约束。以观测,数据根据这个约束,是否有正确的反馈。
说了这么多,恐怕可能还是有人不清楚。我就举两个简单的例子,诸位如果去面数据分析师,或数据挖掘师,不知道怎么回答时,套用我的例子。
1、你打算送女朋友戒指,那么你手上有批品牌和款型名单。你按照价格,风格,材质分类,得出如下结论,钻戒比钢戒贵。大钻戒比小钻戒贵,钢戒款式多。钻戒款式少。OK,这就是数据分析。对于一批数据,根据你的先验约束(按照什么什么划分)获得的结论。
但是,不是最贵的你的女朋友就最喜欢,女人嘛,感性的动物。也不是最贵的你能买的起。这些信息的价值,对你没有意义,你需要的就是用最少的钱,让你 女朋友最开心。由此你需要数据挖掘。最优标准就是,最少的投入,最大的开心。OK。你需要先验的去寻找,贵的戒指不买的理由。哪怕从已有数据中得出。比如 “钻戒款式少”或者“大钻戒也比钢钻戒要小”。同时你要去问问你的女朋友,你觉得怎么样才开心啊。当然,如果你女朋友来一句“反正看你皮夹胖的可以卡住 门,我就不开心”,那你就得继续琢磨,我得找个,刚好投入能让皮夹不卡门的,而且让女朋友开心的。于是,你又去数据分析,此时实际上是用价值的评价标准, 对数据进行价值化因此如果你确定了分析方式,则动作确实是数据分析,但是带上你确定价值化的评价标准的动作,就是数据挖掘了。最终,你可以得到一堆理由, 即少钱,也让女朋友开心。
2、老婆早上就给你50元,让你买一天的菜。要求鸡猪鱼肉俱全,且蛋菜葱蒜豆品必备。你到菜场,先绕一圈,各个档口拉拉家常,问问价格。猪肉十几一 斤,鱼也不便宜。数据分析下来,计算器,劈里啪啦的按,数字长的比韭菜还快。最后得出一价格。这个就是数据分析。根据客观数据,先验的公式,得到的信息。 但对你而言,最大的价值是,用最少的钱,满足老婆的要求,还可以截留1元买根棒棒糖吃。那么你就要开始进行数据挖掘了。但是要有评价标准。多少肉算一天的 菜量。梅花,后坐,小排,蹄旁。怎么个选法,可以让老婆满意,同时价格落于希望承受的空间范围。青菜白菜都是菜,便宜营养我最爱,于是,接着设定范围。几 个轮回,包括中饭怎么配,晚饭怎么配,最终,到腾出一个购买方案,这就是数据挖掘。
简单的说,不谈钱,或者不谈价值,就没有挖掘可言。但凡不谈时,都是数据分析。当然每轮挖掘过程中,又是个数据分析的过程。没有客观数据,没有主观喜好,就没有数据挖掘一说。只有数据分析之为。
所以切记,别把数据分析和数据挖掘混淆了。对于一些公司,热乎的搞名词概念。你也可以在BS的时候,好好的BS他们一下。补充个抽象说法,数据分析,就是先决而后知。 数据挖掘就是先知而后决。决断的决。
分享到:
相关推荐
2. 在商业领域,数据分析和数据挖掘也发挥重要作用,如通过分析消费者购买行为数据,发现啤酒和尿布的关联销售模式,从而指导商业决策。 ### 数据分析与数据挖掘的挑战 1. 数据分析的准确性和结果的可靠性受到多种...
数据挖掘通常需要开发者具备编程能力,如SQL用于数据库操作,C++提供高效编程支持,Python因其易用性和丰富的库资源(如Pandas、Scikit-learn)在数据处理和机器学习中广泛应用,Matlab适合矩阵运算和初步的数据分析...
《MATLAB数据分析与挖掘实战》是一本专注于使用MATLAB进行数据处理、分析和挖掘的专著,适合于对MATLAB有一定基础并希望深入理解和应用数据分析技术的读者。本书结合实例,详细介绍了MATLAB在数据挖掘领域的强大功能...
【数据分析】MATLAB数据分析编程,数据挖掘,大数据分析。 (MATLAB data analysis programming, data mining, big data analysis.) 文件列表: matlab数据分析编程 (0, 2020-05-08) matlab数据分析编程\第1章 数据...
北京大学的这门数据挖掘与数据分析教程深入讲解了这个领域的核心概念和技术。 首先,数据挖掘的目标是揭示隐藏在大量数据背后的模式、趋势和规律,从而帮助用户做出更明智的决策。它包括数据清理、数据集成、数据...
* 数据挖掘与统计学的区别:数据挖掘更侧重于知识发现和模式识别,而统计学更侧重于数据分析和推断。 本 PPT課件涵盖了数据仓库、数据挖掘、OLTP、OLAP 等数据分析和挖掘相关的知识点,为读者提供了一个系统的数据...
大数据分析与挖掘是当今时代最热门的话题之一,随着数据量的增加和技术的发展,大数据分析与挖掘变得越来越重要。大数据分析与挖掘可以应用于各个领域,包括金融、交通、医疗、零售等行业。 大数据分析与挖掘的背景...
Python的数据分析和挖掘的案例,非常不错
MATLAB数据分析与挖掘实战案例(15个案例,均包含完整源码及相应数据集) MATLAB数据分析与挖掘实战案例(15个案例,均包含完整源码及相应数据集) MATLAB数据分析与挖掘实战案例(15个案例,均包含完整源码及相应...
包含数据分析和数据挖掘的学习代码和实战代码 本项目很多内容属于边学边试。参考了书籍,但是很多代码存在过时和错误均被我修改。 数据挖掘是最近几年才出现的一个名词,其归根到底的目的就是经过一系列手段处理...
数据挖掘技术在警务数据分析系统中的应用,是指利用数据挖掘的原理与方法对警务数据进行深度分析和挖掘,以提取有价值的信息和知识。本篇文献综述了数据挖掘技术在警务系统数据分析中的重要性、特点、构建数据存储器...
数据挖掘与大数据分析是当前信息技术领域中的热点话题,这两者在现代企业和科研中扮演着至关重要的角色。电子科技大学开设的《数据挖掘与大数据分析》课程旨在让学生深入理解这两个概念,并掌握相关的理论和技术。 ...
本文主要探讨了基于数据挖掘技术在兵棋推演数据分析中的应用和研究方法,为军事指挥人员提供科学有效的决策支持。 计算机兵棋系统由于其规模大、结构多层次且复杂,使得对其推演数据的分析成为一个难题。数据挖掘...
第2讲_MATLAB数据挖掘基础 共44页.pdf 第3讲_MATLAB数据挖掘算法(上) 共42页.pdf 第4讲_MATLAB数据挖掘算法(下) 共45页.pdf 第5讲_MATLAB高级数据挖掘技术 共23页.pdf 第6讲_MATLAB数据挖掘项目实例 共25页.pdf ...
Python数据分析与挖掘实战是当前大数据时代的一个热门领域,它涵盖了数据获取、清洗、探索、建模和可视化等多个环节。Python语言凭借其简洁易学、丰富的库支持和强大的科学计算能力,已经成为数据分析领域的首选工具...
数据分析精华案例-香水产品数据挖掘实用案例分析
5. **数据挖掘技术**:数据挖掘包括监督学习(如回归、分类)和无监督学习(如聚类、关联规则)。Python的Scikit-learn库提供了丰富的算法实现,如线性回归、逻辑回归、决策树、随机森林、K-Means等。 6. **模型...
数据分析与数据挖掘,杨大川老师主讲的PPT
Python是一种强大的编程语言,尤其在数据分析和挖掘领域中,它被广泛应用。本资料包主要包含的是基于Python的数据分析和挖掘的源代码以及相关的原始数据。这些资源是针对一本实战书籍中的实例,确保所有代码都已经过...
在交通大数据分析和挖掘中,可视化技术可以帮助我们更好地了解交通状况和趋势,提高决策的效率和准确性。 交通大数据分析和挖掘的应用场景 交通大数据分析和挖掘的应用场景非常广阔,例如: * 智能交通:通过交通...