数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:
“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。这种关系令人费解,这是一个真正的规律吗?经过跟踪调查, 研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了 捆绑销售,不出意料,销售量双双增加。”
——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》
第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市卖酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。
原来这个故事在欧美国家也被传唱,出现的版本还不尽相同。但对此质疑的声音也不少,其中有一位叫Daniel J. Power的教授特此撰文,应该是最全面地有理有据揭开这个故事后面的真相。有兴趣的同学可以详细阅读英文全文:What is the "true story" about using data mining to identify a relation between sales of beer and diapers? (http://www.dssresources.com/newsletters/66.php)。主旨内容如下:
· 这家连锁店不是沃尔玛,而是Osco Drugs,一家主要在美国中西部经营的药房和便利店。
· 该公司于1992年就着手进行数据挖掘项目,算是数据挖掘的先驱者。
· 当时的项目收集了来自25家分店、一千两百多万个购物车的信息。
· 数据的确发现:下午5点到7点之间,客户购买了啤酒和尿片。
· 商店管理层的确对此发现表示兴趣。但现实中,并没有重新设计商品的摆放,没有把啤酒和尿布进行捆绑销售。不过,公司保守地对销售流程进行了改造,即在正确的时间放正确数量的正确商品。
这就是啤酒和尿片的故事真相,所以,这其实并不是数据挖掘的好故事。大家对此故事津津乐道,无外乎希望表达:数据挖掘技术是商业决策的好帮手!(作者:Shirley Xie来源:TechTarget中国)
分享到:
相关推荐
啤酒与尿布是数据分析届的神话,指的是购物篮中的商品之间具有关联关系,我是本书的作者,与其让别人大肆发我的盗版,不如我自己上传
但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的...
尿布和啤酒的故事 这是一个老故事, 但每次看总是能从中想到点什么.在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在...
数据分析、挖掘方面入门书籍。通俗易懂,不错的书籍。。。。。。。
没想到这个举 措居然使尿布和啤酒的销量都大 幅增加了。 一、啤酒与尿布 案例背后 数据支持:购物篮数据 数据挖掘技术:关联规则挖掘(Association Rules Mining) 经典算法: Apriori FP-Growth …… 一、啤酒与...
标题中的“行业分类-设备装置-用于尿布等的潮湿检测装置和具有这种装置的尿布”揭示了本文档将探讨的是与卫生护理行业相关的技术,特别是关于尿布的湿度检测装置及其应用。这种装置是现代婴儿护理产品的重要组成部分...
标题中的“行业分类-设备装置-从纸尿布和其类似物中分离和回收有价值物质的分离装置和分离方法”揭示了本主题的核心是关于环保技术,具体涉及到废弃物处理,尤其是针对纸尿布等个人卫生产品中有价值的资源回收。...
北大POJ第1042题代码(C++)
啤酒和尿布的故事是一个著名的数据分析和挖掘的故事。该故事讲述了一家连锁店如何通过数据分析和挖掘来发现啤酒和尿布的销售关系,并据此进行销售策略的调整。这个故事表明了数据分析和挖掘技术在商业决策中的重要...
例如:support({啤酒}–>{尿布}) = 啤酒和尿布同时出现的次数/数据记录数 = 3/5=60%。 2、自信度的定义:confidence(X–>Y) = |X交Y|/|X| = 集合X与集合Y中的项在一条记录中同时出现的次数/集合X出现的个数 。例如:...
在“啤酒与尿布”的故事中,单个的销售数据可能并不具有太多信息,但当大量数据被收集并分析时,人们发现了其中的模式——年轻父亲在购买尿布时常常会顺便买啤酒。这个模式揭示了数据背后的潜在关系,即信息。信息...
关于c++的初步编程问题,是一道例题,书上的也是关于谭浩强
成人智能尿布是一种结合了现代科技的特殊护理产品,它内置传感器,能够通过连接移动应用程序实时监测使用者的状况,尤其适用于老年人和行动不便的人群。当检测到泄漏时,产品会自动发出警报,以便及时更换,保持卫生...
标题和描述中提到的是关于使用半导体激光治疗仪联合呋喃西林液和红霉素软膏治疗婴儿尿布皮炎的一项临床观察研究。这项研究旨在评估这种联合疗法在治疗婴儿尿布皮炎上的效果,对比了传统治疗方法(如使用鞣酸软膏)与...
此外,设计师还可以思考如何通过智能设备与游戏床相结合,比如添加尿布湿度感应器,通过手机应用提醒家长更换尿布,这样的科技元素无疑会提升产品的现代感和实用性。 总的来说,这款婴儿游戏床的可翻转尿布架结构是...
首先,从节省时间和精力的角度来看,“尿布革命”认为通过训练婴儿使用便盆或马桶,可以有效减少父母频繁更换尿布的次数。这一点对于那些新生儿到半岁婴儿家庭来说尤为显著,因为这个年龄段的婴儿需要每两到三小时...
因此,我们的讨论将集中在婴儿游戏围床和尿布架的固定机构设计上。 在婴幼儿护理中,婴儿游戏围床是一个重要的设备,它为宝宝提供了一个安全的玩耍空间,同时让父母可以稍作休息或处理其他事务。尿布架是其中的一个...
在商业应用中,数据挖掘的一个经典例子是“啤酒与尿布”的故事。通过对销售记录的分析,商家发现啤酒和尿布经常被同一顾客一起购买。于是,他们将啤酒放在尿布附近,结果销售额显著增长。这说明通过数据挖掘,可以...
例如,"啤酒与尿布"的故事就是一个经典的案例,揭示了啤酒和尿布之间的潜在关联。 Clementine12.0是一款数据挖掘软件,其中包含了实现关联规则分析的功能。在实验中,首先需要启动该软件,并设计一个管理规则挖掘的...