向合作进化的棘轮
一报还一报策略在静态的群体中得到了很好的表现,那么在一个动态的群体中,情形会如何呢?
为了回答这个问题,实验者用生态学的原理来分析,假设对局者所组成的策略群体是一代一代进化下去的,进化的规则包括:
1.试错。人们对待周围环境时,起初不知道怎么做,于是就试试,哪个结果好就照哪个去做
2.遗传。一个人如果合作性好,他的后代的合作基因就多
3.学习。比赛过程就是对手相互学习的过程,一报还一报的策略好,就有人愿意学习
按照这个思路,假设63个参与者中,谁第一轮的得分高,在第二轮的群体中所占的比例就相应增加,这样群体的结构就会渐渐变化,由此可以看出群体是向什么方向进化的。
结果很有趣
1.一报还一报初始比例为1/63,1000代之后,结构稳定了下来,比例为24%。
2.一些程序在进化的过程中消失了
实验表明
1.群体是越来越合作的
2.一个策略的成功应该以对方的成功为基础,一报还一报策略在2人对局时,得分不可能超过对方,最多平手,但它的总分最高,而哈灵顿程序就不是这样,它得到高分时,对方必然得到低分,它的成功是建立在别人的失败上的,而失败者总是被淘汰的,当失败者被淘汰后,这个从失败者身上占便宜的程序也被淘汰了
一报还一报策略的局限性
一旦产生误解,那么2个一报还一报策略将永远不合作,而选择背叛。
现实中,误解很容易发生,因此一报还一报策略在现实世界中会出现2种缺陷
1.太容易激发背叛
2.缺少一个宣布"到此为止"的机制
因此,有2种解决困局的方式
1.宽大的一报还一报策略:以一定的概率不报复对方的背叛
2.悔过的一报还一报策略:以一定概率主动停止背叛
爱克斯罗德指出:
1.友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件也有可能合作。
2.合作不依靠善意,诚信或者一个外来者的仲裁,也完全可能从自私自利的盘算中产生。
例如一战期间产生的"自己活,也让他人活"的原则,德英两军在战壕战中遇到了3个月的雨季,双方达成了默契,互不攻击对方的粮车,约束自己不开枪杀人,只要对方也这么做。这个原则能实行的原因是,双方军队都陷入了困境,3个月时间给了他们相互适应的机会
人质困境:多人的囚徒困境
亚当-斯密在国富论中写道,当个人在追求私利的时候,市场的看不见的手会导致最佳经济后果,也就是说追求自身利益最大化的同时,也促进了社会公共利益的增长。
这种以个体利益最大化为目标的理性称为"个体理性"
然而,囚徒困境揭示了个人理性的选择与群体理性选择之间的矛盾,从个体利益出发的行为往往不能实现团体的最大利益。同时也揭示了市场理性本身的内在矛盾,从个体理性出发的行为最终不一定能真正实现个体的最大利益,甚至会得到相当差的效果。
可以证明,在人们的相互交往过程中,每个行为主体的利己主义决策结果,可能是有效率的,无效率的,但多次重复这种决策肯定是低效率的
混沌系统中的策略
酒吧博弈:有100个人很喜欢泡酒吧。这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的,也就是说座位是有限的。如果去的人多了,去酒吧的人会感到不舒服。此时,他们留在家中比去酒吧更舒服。假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何作出去还是不去的决定呢?
计算机模拟的结果是最终会形成一个稳定的生态,去酒吧的平均人数很快稳定到了60人,而真实人群的研究发现,去酒吧的人数呈现规律波浪形态
第i周 44人
第i+1周 76人
第i+2周 23人
第i+3周 77人
第i+4周 45人
第i+5周 66人
第i+6周 78人
......
传统经济学认为,经济主体的行动是建立在演绎推理的基础之上的,但事实并非如此,多数人的行动是基于归纳的,因此在酒吧博弈中,人们根据以往的历史来预测去酒吧的人数,那么历史人数就很重要了,然而过去的历史可以是"任意的",所以未来是不可确定的。股票买卖等问题都是酒吧博弈模型的延伸
酒吧博弈的现实启示:
1.从一个非线性系统的整体来说,其变化是不可预测的,要采取正确的决策,就必须了解其变化规律。
2.非线性混沌系统是一个无法完全了解的系统,我们无法知道哪里的量变会产生质变
3.处于混沌系统中的个体,在无法预测的过程中也可以采取恰当的策略,少数者策略是我们关注的重点
自牛顿以来,直线和简化的思想在我们的头脑中一直占据着主导地位,然而今年来,科学家发现,世界并不是那么简单,它并非是直线发展的,而是在关联和交互影响中进化的。也就是说世界上充满着各种不可预测的混沌。线性系统的整体等于部分相加,因此系统中每一部分都可以自由的做自己的事情而不需要关心其他部分。而在非线性系统中,整体并不等于所有部分相加,它可能大于所有部分相加,因为系统中一切都是关联的。
少数派策略
那么有没有可能对一个混沌系统进行干预呢,使其向我们期望的方向发生逆转?答案是肯定的,其中一种方法就是少数派策略。
例子:一个人发现村子里卫生状况非常差,每条街道都脏乱不堪,他想改变村民的习惯,却很难说服他们,他想了很久,最后买了一条很漂亮的裙子送给村里的一位小女孩。小女孩穿上裙子后,女孩的父亲发现她脏兮兮的双手和漂亮的裙子极不协调,就给她好好洗了个澡。但她父亲发现家里的脏乱环境把裙子弄脏了,于是父亲就发动家人把家里好好打扫了一遍,整个家都变干净了。很快这位父亲从干净的家里出来,门口满是垃圾的过道让人难受,于是他发动家人,将门口过道打扫了一遍,不就邻居发现隔壁的环境太令人舒服了,把屋里屋外都打扫了一遍,最后整个村子都变样了。
枪手博弈
彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。
第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?
一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。
我们来分析一下各个枪手的策略。
枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪 瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。我们计算一下三个枪手在上述情况下的存活几率:
甲:24%(被乙丙合射40% X 60% = 24%)
乙:20%(被甲射100% - 80% = 20%)
丙:100%(无人射丙)
通过概率分析,我们发现枪法最差的丙存活的几率最大,枪法好于丙的甲和乙的存活几率远低于丙的存活几率。
现在换一个玩法,三人轮流开枪,谁的机会更大?依然是丙
加入丙先开枪,他应怎么做?放空枪,只要不打破当前局面,他总是有利可图
博弈的2种形式:同时博弈,相继出招博弈
结论:多方博弈时,置身事外也是一种可考虑的选择
重复剔除劣势策略
例子:一次军事演习中,红方要用2个师的兵力,攻克蓝方占据的一座城市。而蓝方的防守兵力是3个师
条件1:红军与蓝军的师级部队战斗力相同
条件2:军队的最小单位为师
条件3:战争中都是易守难攻,兵力相同时,守方获胜
条件4:有2个方向可以发动进攻,分别是A方向,B方向
阶段1:
红方的进攻策略有3个
策略1: 2个师进攻A方向
策略2: 2个师进攻B方向
策略3: A,B方向各有1个师进攻
蓝方的防守策略有4个
策略1: 3个师集中防守A方向
策略2: 2个师防守A方向,1个师防守B方向
策略3: 2个师防守B方向,1个师防守A方向
策略4: 3个师集中防守B方向
经过分析可知: 蓝方有劣势策略,蓝方选择策略1比策略2差,因为策略1防不住红方策略3,同理蓝方策略4比策略3差。
根据理性博弈原则:绝不选择严格劣势策略,因此,蓝方策略可以简化,只剩下策略2和策略3。
阶段2:
剔除蓝方劣势策略后
红方的策略:
策略1: 2个师进攻A方向
策略2: 2个师进攻B方向
策略3: A,B方向各有1个师进攻
蓝方的策略:
策略1: 2个师防守A方向,1个师防守B方向
策略2: 2个师防守B方向,1个师防守A方向
这时,蓝方没有劣势策略了,但是红方反而出现了一个劣势策略,那就是策略3,此时,选择策略3,一定会失败。
再次剔除红方劣势策略后,红方蓝方都只剩下2个策略,此时各方的胜率都是50%
结论:红方兵力劣势与蓝方,但是胜率各是50%,在企业竞争中,也是一样。资本,规模,品牌,人力都处于劣势的企业,可以在某个局部市场上,集中自己所有的资源并整合,造成在细分市场上对强势企业的优势,从而成为市场竞争中的胜利者。
相关推荐
博弈论,这门深奥而有趣的学科,是经济学、数学、计算机科学等多个领域的重要理论工具。它主要研究在策略互动中的决策者如何选择最优策略,以最大化自身的利益。本资料包,"博弈论笔记",提供了对这个领域的基础介绍...
博弈论,英文名为Game Theory,是研究决策者之间相互作用的一种数学理论,广泛应用于经济学、社会学、生物学、计算机科学等多个领域,特别是在ACM(国际大学生程序设计竞赛)中,博弈论作为解决某些复杂问题的有效...
根据给定文件的信息,我们可以提炼出以下关于博弈论的相关知识点: ### 博弈论简介 博弈论是一种数学方法,用于研究决策者之间策略互动的情况。它最初由约翰·冯·诺依曼和奥斯卡·摩根斯特恩在20世纪40年代提出,...
根据提供的标题“广东工业大学《博弈论》历年期末考试试卷(含答案)”及描述,我们可以推测这份文档主要包含了广东工业大学关于《博弈论》课程的历年期末考试题目及其对应的答案。以下将围绕《博弈论》这一主题展开...
接下来的讲座涉及了更加复杂的博弈论主题,包括进化稳定、序贯博弈、逆向归纳、不完全信息、子博弈精炼均衡、重复博弈、非对称信息等。 - **进化稳定**:探讨生物进化过程中种群策略的稳定性。 - **序贯博弈**:...
博弈论与竞争策略归纳.pdf
博弈论,又称游戏理论,是研究决策者在有冲突或合作情况下的决策选择的一种数学工具。这个领域结合了数学、经济学、心理学和社会科学等多个领域的知识,广泛应用于社会科学、生物学、军事战略以及计算机科学等多个...
### 博弈论在网络安全中的应用 #### 一、引言与基础知识介绍 博弈论作为研究决策者之间策略互动的一种理论,在多个领域如经济学、管理学、计算机科学等都有着广泛的应用。网络安全作为现代社会信息技术发展的重要...
到了80至90年代,博弈论进一步发展,提出了顺推归纳法、序列均衡和进化博弈理论。 博弈论在经济学中的应用极其广泛,包括但不限于产业组织理论、信息经济学、讨价还价理论、拍卖理论、公共经济学、产权与制度分析、...
博弈论与网络安全和隐私的研究领域涉及将博弈论的理论方法应用于解决计算机和通信网络中的安全性和隐私问题。在网络安全领域中,博弈论被用来分析在不同参与者之间可能发生的策略性互动,以及这些互动如何影响网络的...
完全信息动态博弈是博弈论中的一个重要概念,主要探讨在所有参与者拥有全部信息的条件下,博弈如何进行和结果如何决定。这种博弈通常通过扩展形式来表示,即博弈树模型,其中包括五个基本要素: 1. **局中人(N)**:...
该PPT列出了一些经典的博弈论教材,如罗云峰的《博弈论教程》、姚国庆的《博弈论》、张维迎的《博弈论与信息经济学》等,这些资源可以深入学习博弈论的理论和应用。 通过学习管理学博弈论,我们可以更好地理解和...
【博弈论作业答案详解】 1. **博弈论基础与纳什均衡** 博弈论是研究决策者之间互动行为的数学理论,其中的核心概念是纳什均衡。纳什均衡是指在博弈中,每个参与者都无法通过单方面改变策略来提高自己的收益,即...
博弈论是一种分析决策者在互动情境下如何做出最佳选择的数学工具。在多个领域,如经济学、政治学、生物学甚至心理学,博弈论都有广泛的应用。以下是对给定内容的详细解释: 1. **纯策略纳什均衡**: 在第一个博弈...
博弈论是一种分析决策者之间互动行为的数学工具,尤其在经济学、政治学、社会学以及生物学等领域有着广泛的应用。重复博弈是博弈论的一个重要分支,它研究的是相同结构的博弈在一定时间内反复进行的情况。与一次性...
本题涉及到多个博弈论的概念,包括纯策略与混合策略纳什均衡、逆向归纳法、不完美信息博弈、贝叶斯均衡以及信号博弈。 一、纳什均衡是博弈论中的核心概念,指每个参与者在考虑其他人的策略选择后,没有动机改变自己...
博弈论是经济学、决策科学和游戏理论中的核心概念,它研究在有冲突和合作的多主体环境下,参与者如何做出选择以最大化自身利益。在“国外博弈论lecture13”这一主题中,主要讨论了动态博弈论(Dynamic games)及其在...