囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。以下是实现一般形式的其中一例:
有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性。然后,庄家翻开两个参与者卡片,根据以下规则支付利益:
· 一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
· 二人都合作:各得3分(合作报酬)。
· 二人都背叛:各得1分(背叛惩罚)。
用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):
一般形式囚徒困境的支付矩阵
|
以“T、R、P、S”符号表示
|
以“胜-负”术语表示
|
||||||
合作
|
背叛
|
合作
|
背叛
|
合作
|
背叛
|
|||
合作
|
3, 3
|
0, 5
|
合作
|
R, R
|
S, T
|
合作
|
胜-胜
|
大负-大胜
|
背叛
|
5, 0
|
1, 1
|
背叛
|
T, S
|
P, P
|
背叛
|
大胜-大负
|
负-负
|
简单博弈获得的点数可以得出一些一般化的结论。
T、R、P、S符号表
|
||||
符号
|
分数
|
英文
|
中文(非术语)
|
解释
|
T
|
5
|
Temptation
|
背叛诱惑
|
单独背叛成功所得。
|
R
|
3
|
Reward
|
合作报酬
|
共同合作所得
|
P
|
1
|
Punishment
|
背叛惩罚
|
共同背叛所得
|
S
|
0
|
Suckers
|
受骗支付
|
被单独背叛所获
|
若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S
(解:从5>3>1>0获得以上不等式)
若以整体获分而言,将得出以下不等式。
2R>T+S或2R>2P
(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)
而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。以上理论是道格拉斯·霍夫施塔特(侯世达)创建的。
相关推荐
在本文中,我们将深入探讨囚徒困境的演化博弈理论,并以Python编程语言为工具,介绍如何实现这一概念的可视化模拟。囚徒困境是博弈论中的一个经典案例,它揭示了个体利益与集体利益之间的冲突,以及合作与背叛的微妙...
在IT领域,尤其是在复杂系统建模与仿真方面,囚徒困境博弈(Prisoner's Dilemma)是一个重要的理论模型,它常被用来研究合作与背叛的行为动态。此模型结合了数学、经济学和计算机科学,而Matlab作为一种强大的数值...
在本文中,我们将深入探讨“囚徒困境”这一经典博弈论概念,并利用MATLAB进行仿真。囚徒困境是博弈论中的一个基础模型,用于描述两个合作方在无法直接沟通的情况下,如何选择对自己最有利的策略。它展示了个体利益与...
论文研究-囚徒困境中基于非均匀连接的促合作控制设计.pdf, 本文研究"囚徒困境"中促进合作演化的机制,设计"合作识别"和"背叛识别"两种控制形式,并分析合作在相应控制之...
**囚徒困境博弈实验报告详解** 本实验报告围绕囚徒困境这一经典的博弈理论模型展开,旨在探讨合作的可能性和影响合作的因素。实验分为四个模块,分别探究了无沟通、可廉价磋商、有惩罚以及重复博弈条件下的囚徒困境...
囚徒困境作为博弈论中的经典案例,生动地揭示了个体在追求最优个人结果时可能导致的集体非理性结局。 囚徒困境模型描述的是这样一个情景:两个犯罪分子被警方逮捕并分别关押,无法进行沟通。他们面临的选择是,要么...
在“囚徒困境”这个经典案例中,博弈论揭示了个体利益与集体利益之间的矛盾。本项目旨在通过 MATLAB 编程模拟囚徒困境中的博弈策略,以探索如何提高双方共赢的概率。 首先,我们要理解囚徒困境的基本设定。两个犯罪...
在这个“囚徒困境”的案例中,A和B面临共同消费电视机这一公共产品的决策。电视机的价值被双方共同认定为$300,高于其$400的成本,理论上应被购置。然而,问题在于,由于公共产品的特性,存在“免费搭车”现象,即一...
本文研究了基于环格的局部交互社会网络中的空间演化囚徒困境博弈,探讨了合作行为在没有中心权威的个体间如何产生、推广和演化的问题。通过构建一个个体与邻居进行互动的空间囚徒困境博弈模型,并引入模仿学习机制来...
本项目结合了这两个概念,通过MATLAB编程实现了基于复杂网络的囚徒困境博弈,提供了丰富的学习和研究素材。下面我们将深入探讨相关知识点。 首先,我们来理解“囚徒困境”博弈。这是一个经典的博弈理论模型,用于...
资源名:基于复杂网络的囚徒困境博弈matlab源程序,基于方形格子或无标度网络,matlab源码 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系...
互联网传媒行业:消费互联网公司的囚徒困境时刻-20190327-中信建投-20页.pdf
"博弈论囚徒困境" 博弈论囚徒困境是博弈论中的一种典型模型,反映了个人最佳选择并非团体最佳选择的矛盾。该模型由梅里尔·弗勒德和梅尔文·德雷希尔于1950年提出,后来由艾伯特·塔克尔以囚徒方式阐述,并命名为...
"博弈论与囚徒困境展示PPT教案学习" 博弈论是研究在策略性互动中,多个参与者之间的决策和选择的学科。它广泛应用于经济学、政治学、社会学、心理学、生物学等领域。 在博弈论中,囚徒困境(Prisoner's Dilemma)...