`
visionary_2006
  • 浏览: 129073 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

囚徒困境

 
阅读更多
囚徒困境简介
------------------------------------------------------------  
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

  单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

  在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

经典的囚徒困境
------------------------------------------------------------

1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:

   甲沉默(合作)  甲认罪(背叛) 
乙沉默(合作)  二人同服刑半年  甲即时获释;乙服刑10年 
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年 

  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

来自"http://wiki.mbalib.com/wiki/%E5%9B%9A%E5%BE%92%E5%9B%B0%E5%A2%83"
分享到:
评论

相关推荐

    囚徒困境的演化博弈实现(Python)

    在本文中,我们将深入探讨囚徒困境的演化博弈理论,并以Python编程语言为工具,介绍如何实现这一概念的可视化模拟。囚徒困境是博弈论中的一个经典案例,它揭示了个体利益与集体利益之间的冲突,以及合作与背叛的微妙...

    复杂网络囚徒困境博弈matlab源程序

    在IT领域,尤其是在复杂系统建模与仿真方面,囚徒困境博弈(Prisoner's Dilemma)是一个重要的理论模型,它常被用来研究合作与背叛的行为动态。此模型结合了数学、经济学和计算机科学,而Matlab作为一种强大的数值...

    matlab仿真囚徒困境问题

    在本文中,我们将深入探讨“囚徒困境”这一经典博弈论概念,并利用MATLAB进行仿真。囚徒困境是博弈论中的一个基础模型,用于描述两个合作方在无法直接沟通的情况下,如何选择对自己最有利的策略。它展示了个体利益与...

    论文研究-囚徒困境中基于非均匀连接的促合作控制设计.pdf

    论文研究-囚徒困境中基于非均匀连接的促合作控制设计.pdf, 本文研究"囚徒困境"中促进合作演化的机制,设计"合作识别"和"背叛识别"两种控制形式,并分析合作在相应控制之...

    囚徒困境博弈实验-3页.pdf

    **囚徒困境博弈实验报告详解** 本实验报告围绕囚徒困境这一经典的博弈理论模型展开,旨在探讨合作的可能性和影响合作的因素。实验分为四个模块,分别探究了无沟通、可廉价磋商、有惩罚以及重复博弈条件下的囚徒困境...

    博弈论-囚徒困境思路

    其中,“囚徒困境”是博弈论中的经典模型,它展示了个体理性可能导致集体非理性的结果。在这个模型中,两个被捕的囚犯面临是否互相背叛的选择,如果两人都保持沉默,他们都能获得较轻的刑期;如果一方告发另一方,...

    囚徒困境中的博弈策略的模拟:尝试了采用几种策略进行博弈使最终双赢的概率变大,matlab源码

    在“囚徒困境”这个经典案例中,博弈论揭示了个体利益与集体利益之间的矛盾。本项目旨在通过 MATLAB 编程模拟囚徒困境中的博弈策略,以探索如何提高双方共赢的概率。 首先,我们要理解囚徒困境的基本设定。两个犯罪...

    公共产品特点与囚徒困境.pdf

    在这个“囚徒困境”的案例中,A和B面临共同消费电视机这一公共产品的决策。电视机的价值被双方共同认定为$300,高于其$400的成本,理论上应被购置。然而,问题在于,由于公共产品的特性,存在“免费搭车”现象,即一...

    空间演化囚徒困境基于环格与模仿的合作涌现

    本文研究了基于环格的局部交互社会网络中的空间演化囚徒困境博弈,探讨了合作行为在没有中心权威的个体间如何产生、推广和演化的问题。通过构建一个个体与邻居进行互动的空间囚徒困境博弈模型,并引入模仿学习机制来...

    基于matlab实现基于复杂网络的囚徒困境博弈matlab源程序,基于方形格子或无标度网络 .rar

    本项目结合了这两个概念,通过MATLAB编程实现了基于复杂网络的囚徒困境博弈,提供了丰富的学习和研究素材。下面我们将深入探讨相关知识点。 首先,我们来理解“囚徒困境”博弈。这是一个经典的博弈理论模型,用于...

    基于复杂网络的囚徒困境博弈matlab源程序,基于方形格子或无标度网络,matlab源码

    资源名:基于复杂网络的囚徒困境博弈matlab源程序,基于方形格子或无标度网络,matlab源码 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系...

    互联网传媒行业:消费互联网公司的囚徒困境时刻-20190327-中信建投-20页.pdf

    互联网传媒行业:消费互联网公司的囚徒困境时刻-20190327-中信建投-20页.pdf

    博弈论囚徒困境.pdf

    "博弈论囚徒困境" 博弈论囚徒困境是博弈论中的一种典型模型,反映了个人最佳选择并非团体最佳选择的矛盾。该模型由梅里尔·弗勒德和梅尔文·德雷希尔于1950年提出,后来由艾伯特·塔克尔以囚徒方式阐述,并命名为...

    博弈论与囚徒困境展示PPT教案学习.pptx

    "博弈论与囚徒困境展示PPT教案学习" 博弈论是研究在策略性互动中,多个参与者之间的决策和选择的学科。它广泛应用于经济学、政治学、社会学、心理学、生物学等领域。 在博弈论中,囚徒困境(Prisoner's Dilemma)...

Global site tag (gtag.js) - Google Analytics