`
wx1569510009
  • 浏览: 52939 次
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

大数据预测不准世界杯

 
阅读更多

     人类一思考,上帝就发笑;世界杯一来到,上帝笑得血压也升高。倒不是足球踢得多欢乐,而是世界杯预测太恶搞。



  我略微总结了下,剔除掉贝利和大校这种声名卓著的反向指标,煞有介事的世界杯预测大致可以分为五类:一是实力决定论,以高盛和德银等投行为代表,将FIFA排名、过往战绩、近期表现、球员身价、赌球赔率、国家经济等一系列数据综合反映出的球队实力作为预测依据,用计量模型计算出看上去精确至极的概率,只不过,计算结果有较大差异,比如,高盛预测巴西夺冠,德银则更看好英格兰。



  二是条件决定论,以霍金教授为代表,将各种客观条件对某一球队的表现影响糅到一个获胜公式里,这些条件包括球场选择、裁判国籍、球衣选择、阵型选择和交通工具选择等,只不过,这种公式的预测有效时段很短,所以在决赛还离得远的现在,公式还预测不出最后的冠军归属。



  三是流言决定论,以雅虎和微软Bing为代表,将以亿为单位的网络噪音转化为清晰的结果信号。虽然这种互联网魔术看上去既科学又玄妙,甚至可以从经济学的“预期自我实现”理论加以解释,但总让人联想到古时候无论中国还是西方,帝王对童谣和吟游诗人作品的格外关注。



  四是宿命归属论,以一则关于1966年和2014年的时空重叠热帖为代表,1966年,欧冠冠军是皇家马德里,西甲冠军是马德里竞技,西乙冠军是拉科鲁尼亚,意甲冠军是尤文图斯,皇家贝蒂斯降级西乙,2014年无一例外都是如此。“Yesterday once more”就剩世界杯了,1966年是英格兰夺冠,按照宿命归属,2014年英格兰也将问鼎。



  五是动物先知论,以章鱼保罗为代表,2008年保罗预测欧洲杯6场5胜,2010年保罗预测南非世界杯8场全胜,只不过,保罗没能活到2014年巴西世界杯揭幕,于是,乌龟、大象、熊猫等动物先知又登上了预测舞台,只不过,保罗的辉煌再难复制。



  当然,所有这些世界杯预测或多或少都有恶搞的成分,当不得真。但稍微严肃一下,细致分析这五种方法论,除了最后一种,剩下四种都用到了大数据,这恰是时下大数据热的一种表现。从世界杯预测看大数据热,三个误区值得警醒。



  首先,大数据并不能解决所有问题。大数据是很有用的,几乎每一个环节,包括产品设计、市场定位、目标选择、销售策略和模式修正,都能靠大数据来解决问题,甚至连各种和商业无关的问题,也都能从大数据这里得到帮助。但大数据并不是万能的,大数据能解决的都是客观问题,而不是主观问题。就拿世界杯预测来说,谁能夺冠取决于多种因素,各种预测方法论本质上并无区别,只不过它们对不同决定要素赋予的权重不尽相同。也就是说,决定夺冠的要素是什么,这是一个主观问题,大数据只能说明客观的状态,无法对夹杂重要主观判断的问题直接给出解答。



  其次,数据并不是越大越好。数据分析早就存在,大数据火爆却是最近的事情,其中的区别就在一个“大”字。从道理上讲,数据种类越多、序列越长,包含的信息就越丰富。但值得强调的是,信息越丰富未必就越好,当下是一个信息大爆炸的时代,信息越多有的时候越不利于获知。而且更重要的是,像世界杯预测,明显是一个核心信息不突出的事情,所以信息之间反而容易形成无逻辑的冲突,这恰是预测方法论众多,谁都不靠谱的原因。此外,数据越大,数据处理过程中的选择就越多,而选择总是难以回避道德风险问题,每一个大数据分析者,都得面对为特定目标而选择的诱惑,“有选择的选择”往往是大数据反而模糊了真相的潜在原因。



  最后,大数据搞不定薛定谔的猫。在盒子打开前,薛定谔的猫既是活的,又是死的,只有打开盒子这一行为,才能导致状态叠加的坍塌,不确定性才会消失。也就是说,在世界杯真正开始前,32支球队都是冠军,又都不是冠军,只有踢起来才能见真章。大数据分析都是基于既成事实的,它更擅长于告诉我们,世界是怎样,而不是世界应是怎样和将会怎样。在不确定性面前,大数据是无力的,所以究其根本,大数据不是用来预测的。大数据能带给我们的,是知识,是获知,而不是判断,更不是武断,而尊重不确定性,才是正确使用知识的一部分。

转载于:https://my.oschina.net/u/1160813/blog/280781

分享到:
评论

相关推荐

    大数据预测:告诉你谁会点击、购买、死去或撒谎(美)埃里克·西格尔

    大数据时代下,作为其核心应用,预测已经在各个领域得到广泛应用,未来预测分析必定会成为所有领域的关键技术。... 我们的世界会因为预测变成什么样? 以上以及其他所有预测的相关内容,《大数据预测》都会告诉你。

    大数据应用场景大数据预测ppt课件.ppt

    【大数据预测概述】 大数据预测是大数据技术在众多应用领域中的核心功能,它的核心价值在于能够通过对海量数据的分析,预测未来可能出现的状况,从而帮助企业做出更明智的决策。与传统的数据分析相比,大数据预测...

    2.1大数据预测因为噪声失效

    2.1大数据预测因为噪声失效 2.2大数据与机器学习 3.1规则阶段 3.2机器学习阶段发展至连接主义阶段 3.3课间答疑 3.4连接主义阶段发展至深度学习阶段 3.5三个阶段总结分析 3.6人工智能的应用(一) 3.7人工智能的应用...

    大数据应用场景-大数据预测.pptx

    大数据预测是大数据技术在众多应用领域中的核心环节,它的价值在于通过海量数据的分析和处理,预测未来可能出现的情况,从而为企业决策提供有力支持。大数据预测不仅仅是对过去的回顾,更是对未来的预测,它使得数据...

    大数据应用场景-大数据预测.ppt

    大数据应用场景-大数据预测 大数据预测是大数据最核心的应用,大数据预测将传统意义预测拓展到“现测”。大数据预测是基于大数据和预测模型去预测未来某件事情的概率,让分析从“面向已经发生的过去”转向“面向...

    利用互联网大数据预测季度GDP增速的方法研究.pdf

    利用互联网大数据预测季度GDP增速的方法研究.pdf

    大数据预测.pdf

    360公司董事长周鸿祎、《罗辑思维》主讲人罗振宇郑重推荐2020年的一天,在你驱车前往公司的路上,...关于预测分析,你想了解的全部,你的生活以及这个世界会因为预测分析改变到什么程度,《大数据预测》都会告诉你。

    大数据应用场景之-大数据预测.doc

    大数据预测是现代商业环境中的一种关键应用,它利用大数据和预测模型对未来可能出现的事件进行概率预测,从而帮助企业从历史分析转向前瞻性决策。与传统的数据分析相比,大数据预测的优势在于它能将复杂的预测问题...

    大数据应用场景及相关技术

    大数据预测是指基于大数据和预测模型来预测未来某件事情的概率。它的逻辑基础是,每一种非常规的变化事前一定有征兆,每一件事情都有迹可循,如果找到了征兆与变化之间的规律,就可以进行预测。大数据预测无法确定某...

    大数据应用场景(大数据预测)

    大数据应用场景(大数据预测),精品一级

    大规模资金流入流出大数据预测TOP3与4答辩ppt

    标题中的“大规模资金流入流出大数据预测TOP3与4答辩ppt”揭示了这是一个关于大数据预测的学术或项目报告,重点在于预测资金流动的前三名和第四名情况。这可能是一个研究项目,或者是某个竞赛如“天池大数据预测答辩...

    基于非完备大数据的业务预测.pdf

    【标题】: "基于非完备大数据的业务预测" 【描述】: 该文档涉及的是利用非完备大数据进行业务预测的技术和方法。非完备大数据是指在实际应用中,由于各种原因如缺失值、不完整信息或异常数据导致的数据不完全状态。...

    大数据分析、大数据预测课题

    大数据分析、大数据预测课题

    2017年端午节出行大数据预测及安全指南-final1

    2017年端午节出行大数据预测及安全指南2017年端午节出行大数据预测及安全指南2017年端午节出行大数据预测及安全指南《2017年端午节出行大数据预测及安全指

    大数据-FIFA世界杯(EDA)

    本文数据集

    大数据预测

    360公司董事长周鸿祎、《罗辑思维》主讲人罗振宇郑重推荐, 2020年的一天,在你驱车前往公司的路上..., 关于预测分析,你想了解的全部,你的生活以及这个世界会因为预测分析改变到什么程度,《大数据预测》都会告诉你。

    大数据预测处理模式研究(1).pdf

    大数据预测处理模式研究(1).pdf

    基于增强可伸缩随机森林的高维大数据预测分析系统.pdf

    本文提出了一种基于增强可伸缩随机森林(Enhancing Scalable Random Forest, ESRF)的高维大数据预测分析系统,旨在应对大数据环境下数据复杂性、异构性、安全性、可伸缩性及大规模数据量等问题,提高大数据的预测...

Global site tag (gtag.js) - Google Analytics