`

存活者偏差(转载)

阅读更多

转载自:http://forum.eetchina.com/FORUM_POST_10008_1200113569_0.HTM?click_from=8800021743,9014954723,2009-04-01,EECOL,FORUM_ALERT

 

1941 年,第二次世界大战正打得如火如荼。有一天,美国哥伦比亚大学著名统计学 家沃德 教授 (Abraham Wald) 遇到了一个意外的访客, 那是英国皇家空军的作战指挥官。
 
他说:

沃德 教授,每次飞行员出发去执行轰炸任务, 我们最怕听到的回报是: 『呼叫总部,我中弹了!』   请协助我们改善这个攸关飞行员生死的难题吧!」
 
    
沃德接下这个紧急研究案,他受委托分析德国地面炮火击中联军轰炸机的资料,并且以统计专业,建议机体装甲应该如何加强,才能降低被炮火击落的机会。但依照当时的航空技术,机体装甲只能局部加强,否则机体过重,会导致起飞困难及操控迟钝。

沃德将联军轰炸机的弹着点资料,描绘成两张比较表, 沃德的研究发现,机翼是最容易被击中的部位,   而飞行员的座舱与机尾,则是最少被击中的部位。 沃德详尽的资料分析,令英国皇家空军十分满意。
    
但在研究成果报告的会议上,却发生一场激辩。
    
负责该项目的作战指挥官说:

「沃德 教授的研究清楚地显示,联军轰炸机的机翼,弹孔密密麻麻,最容易中弹。因此,我们应该加强机翼的装甲。」
 
沃德客气但坚定地说:

「将军,我尊敬你在飞行上的专业,   但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿最少发现弹孔。」

  在全场错愕怀疑的眼光中,沃德解释说:

「我所分析的样本中,只包含顺利返回基地的轰炸机。   从统计的观点来看,我认为被多次击中机翼的轰炸机, 似乎还是能够安全返航,而飞机很少发现弹着点的部位,并非真的不会中弹, 而是一旦中弹,根本就无法返航。」

指挥官反驳说:

「我很佩服沃德教授没有任何飞行经验,就敢做这么大胆的推论,就我个人而言,过去在执行任务时,也曾多次机翼中弹严重受创,要不是我飞行技术老到,运气也不错,早就机毁人亡了,所以,我依然强烈主张应该加强机翼的装甲。」       

这两种意见僵持不下,皇家空军部部长陷入苦思。他到底要相信这个作战经验丰富的飞将军, 还是要相信一个独排众议的统计学家?
   
由于战况紧急,无法做更进一步的研究,部长决定接受沃德的建议,立刻加强驾驶舱与机尾发动机的防御装甲。不久之后,联军轰炸机被击落的比例,果然显著降低。为了确认这个决策的正确性,一段时间后,英国军方动用了敌后工作人员,搜集了部份坠毁在德国境内的联军飞机残骸,他们中弹的部位,果真如沃德所预料,主要集中在驾驶舱与发动机的位置。

看不见的弹痕最致命 乍看之下,作战指挥官加强机翼装甲的决定十分合理, 但他忽略了一个事实:弹着点的分布,是一种严重偏误的资料。   因为最关键的资料,其实是在被击落的飞机身上, 但这些飞机却无法被观察到,因此,布满了弹痕的机翼,反而是飞机最强韧的部位。

空军作战指挥官差点因为太重视「看得见」的弹痕,反而做出错误的决策。
 
这个案例有两个特别值得警惕的地方。死掉或被俘的人无法发表意见。
    

  第一, 搜集更多资料,并不会改善决策品质。 由于弹痕资料的来源本身就有严重的偏误,努力搜集更多的资料,恐怕只会更加深原有的误解。
 

第二,召集更多作战经验丰富的飞行员来提供专业意见,也不能改善决策品质,因为这些飞行员,正是产生偏误资料过程中的一环。他们都是安全回航的飞行员,虽然可能有机翼中弹的经验,但都不是驾驶舱或发动机中弹的「烈士」。
  
简单的说, 当他们愈认真凝视那些「看得到」的弹痕,他们离真相就愈远。
 
    
信息界有所谓「 Garbage In, Garbage Out 」,
    
前提(或假设)若是错误,再漂亮的统计算式或方法、再多的资料,也不能让后面的推论变得正确。 在管理实务与日常生活中,许多关键的资料, 也像上述轰炸机的个案一样,会因为「失败」而观察不到。
 
    
台大 刘顺仁 教授在著作《决胜》一书中, 对「存活者偏差 (survivorship
 bias)
」举例说明,是我读过的书中最生动贴切又清楚的一个。如果有一位 70 岁的老人在电视上说,   他就是靠每天抽一包烟、嚼一包槟榔才能长寿, 请想起「死人没法上电视说话」这件事。
    
同样的道理,不是那个地方长寿的老人家吃或喝某东西, 某东西就是养生圣品。
    

再看一个骗钱的例子(这已经进化到 E-mail 版)
     1 2 你接到一封匿名信,
向你表示,这个月市场会上涨,结果市场果然上涨,但你不以为意,因为大家都知道有元月效应这回事 (历年来一月间股价涨多跌少)。
   
到了 2 1 ,你又接到另一封信,向你表示,市场将下跌。这一次,又给那封信说中了。
     3 1 再接到一封信,情形一样。

7 月,你对那位匿名人士的先见之明很感兴趣,对方邀你投资某个海外基金。   于是你把全部的储蓄拿出来投资 , 两个月以后,那些钱有如肉包子打狗,一去不回。
     
你伏在邻居的肩膀上嚎啕大哭,他告诉你,他也接过两封这种神秘信,但寄到第二封就停了。
    
他说,第一封信的预测正确,但第二封不正确。
    
这是怎么一回事?
    
那些骗子玩的把戏是,他们从电话簿找出一万个人名,寄出后市看涨的信给其中一半的人, 后市看跌的信给另一半的人。
     
一个月后,将有五千人接到的信预测正确, 然后再针对这五千人如法炮制。   再一个月后,剩下二千五百人接到的信预测正确, 如此直到名单上剩下五百人,其中会有两百人受骗上当, 因此骗子只要花几千美元的邮资,便可赚进数百万美元。 把手法作些改变。
    
某骗子假装投顾老师招收会员,跟你说你可以先加入一般会员,等你觉得准了再加入 VIP 会员。这改变更巧妙的地方在于,骗子一开始就能赚到钱,此外 VIP 会员还会帮骗子建立口碑,证明骗子有多准:存活者偏差 (survivorship bias)
      
只要信息不流通, 其它人不知道这假的投顾老师有多么(不)准。

分享到:
评论

相关推荐

    存活检查的工具

    支持主机IP和URL,可以迅速的探测主机系统和URL是否存活。

    局域网探测主机存活局域网 主机存活 arp

    本文将深入探讨如何使用ARP(地址解析协议)协议来探测局域网内的主机存活状态,以及如何利用VC(Visual C++)进行源代码编写。 ARP,即Address Resolution Protocol,是TCP/IP协议栈中的一个关键组件。它负责将...

    存活检测.py

    存活检测

    python网址存活测试.zip_FZJ_py 网站存活_python脚本检测网站是否存活_网站存活

    一个简单的python脚本,实现如何测试网站存活。 使用格式如下: python url.py url.txt 线程数 python url.py url.txt 100 需要提前将url放在url.txt内 存活的网站结果将输出在jie.txt里面

    局域网ip存活扫描最新版

    因此,专门用于检测局域网中活跃设备的工具——局域网IP存活扫描应运而生。 局域网IP存活扫描是一个高效的网络管理解决方案,能够帮助网络管理员或IT技术人员轻松地识别局域网中哪些设备是在线的。通过运行这个工具...

    扫描网段存活

    总的来说,这个批处理脚本为用户提供了便捷的网络诊断工具,对于初学者和机房运维人员来说,是一个实用的自我学习和实践案例。通过理解并运用这个工具,可以提高网络管理效率,提升网络安全性,并且更好地理解和掌握...

    南美对虾在国内的存活率

    本研究由叶仁杰和陈让珠进行,旨在确定国内养殖南美对虾的存活率基准,以便行业内人士比较不同养殖场的效益,并为投资者提供经济收益的预测依据。 研究采用了FPF模式,即虾苗、物理环境和饲料三个主要因素的分析...

    在局域网查找存活主机的资源

    在局域网(LAN)中查找存活主机是网络管理员、安全专家或普通用户进行网络诊断和管理时常用的一项技能。这通常涉及到网络扫描,通过发送数据包并接收回应来确定哪些设备正在网络上运行。本篇文章将深入探讨如何在...

    局域网主机存活监控脚本

    局域网主机存活监控脚本

    网站存活和URL爬虫.zip

    网站存活和URL爬虫是一种基于Python3开发的工具,用于自动化地检查网站的在线状态以及爬取其中的URL。这个工具结合了批量处理和安全检测的功能,特别适用于网络安全专业人士进行大规模的网站渗透测试或安全审计。它...

    PHP资源,全存活的资源

    “PHP资源,全存活的资源”这一标题及描述,明确指出这是一份有关PHP资源的列表,其中的资源均处于活跃状态,可以正常使用。对于学习或从事PHP开发工作的人员来说,这些资源非常有价值。 #### 二、知识点详解 ####...

    基于ARP发现内网存活主机(第十三课).docx

    在Linux和Windows环境中,有多款工具可以用来进行ARP扫描,以探测内网中的存活主机: 1. **nmap**:nmap是一款强大的网络扫描工具,可以执行多种扫描类型,包括无连接扫描(-sn)和ARP ping扫描(-PR)。例如,`...

    20030525_在理性与平实中存活1

    一、公司发展的宏观商业模式已经确立 二、公司发展的微观商业模式就是一部分有效和谐的方法论,完成企业管理诸元素从端到端、高质、快捷、有效的管理 三、既然我们已经确

    ping探测目标主机是否存活

    标题中的“ping探测目标主机是否存活”涉及到网络通信的基本概念,即使用ping命令来检查网络上的另一台设备是否可以响应。Ping是Internet控制消息协议(ICMP)的一部分,用于网络诊断。通过发送ICMP回显请求数据包到...

    网络链路存活探测技术分析

    网络链路存活探测技术分析

    第二十二课:基于SMB发现内网存活主机.docx

    在进行此类扫描活动时,需要遵守相关的法律法规,并获得所有者的明确授权。非法扫描可能违反法律并导致法律责任。此外,在实际操作中还需要注意以下几点: - **避免干扰正常业务**:在进行大规模扫描时,应该尽量...

    批量快速Ping扫描工具,存活主机检测工具,在线主机检测

    “存活主机检测”是网络扫描的一个关键方面,它意味着工具会发送Ping请求并等待响应。如果接收到回应,那么就表明目标主机在线并且网络可达。这对于网络故障排查、服务监控、网络安全评估等任务非常有用。 “在线...

    基于UDP发现内网存活主机(第十二课).docx

    基于UDP发现内网存活主机(第十二课).docx

    Kaggle竞赛之Titanic存活预测2

    4. **模型评估**:常用的评估指标是准确率、精确率、召回率和F1分数,但对于不平衡数据集(如本例,存活者比例较低),AUC-ROC曲线和查准率-查全率曲线更为合适。Kaggle竞赛通常使用Log Loss或Accuracy作为评分标准...

Global site tag (gtag.js) - Google Analytics