<<博弈论>>归纳2 -

永夜-极光

浏览: 254261 次
性别:
来自: 深圳

最近访客更多访客>>

amo

u012363178

shenyouhai

zjamson

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

<<博弈论>>归纳2

博客分类：

随笔

向合作进化的棘轮

一报还一报策略在静态的群体中得到了很好的表现,那么在一个动态的群体中,情形会如何呢?

为了回答这个问题,实验者用生态学的原理来分析,假设对局者所组成的策略群体是一代一代进化下去的,进化的规则包括:

1.试错。人们对待周围环境时,起初不知道怎么做,于是就试试,哪个结果好就照哪个去做

2.遗传。一个人如果合作性好,他的后代的合作基因就多

3.学习。比赛过程就是对手相互学习的过程,一报还一报的策略好,就有人愿意学习

按照这个思路,假设63个参与者中,谁第一轮的得分高,在第二轮的群体中所占的比例就相应增加,这样群体的结构就会渐渐变化,由此可以看出群体是向什么方向进化的。

结果很有趣

1.一报还一报初始比例为1/63,1000代之后,结构稳定了下来,比例为24%。

2.一些程序在进化的过程中消失了

实验表明

1.群体是越来越合作的

2.一个策略的成功应该以对方的成功为基础,一报还一报策略在2人对局时,得分不可能超过对方,最多平手,但它的总分最高,而哈灵顿程序就不是这样,它得到高分时,对方必然得到低分,它的成功是建立在别人的失败上的,而失败者总是被淘汰的,当失败者被淘汰后,这个从失败者身上占便宜的程序也被淘汰了

一报还一报策略的局限性

一旦产生误解,那么2个一报还一报策略将永远不合作,而选择背叛。

现实中,误解很容易发生,因此一报还一报策略在现实世界中会出现2种缺陷

1.太容易激发背叛

2.缺少一个宣布"到此为止"的机制

因此,有2种解决困局的方式

1.宽大的一报还一报策略:以一定的概率不报复对方的背叛

2.悔过的一报还一报策略:以一定概率主动停止背叛

爱克斯罗德指出:

1.友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件也有可能合作。

2.合作不依靠善意,诚信或者一个外来者的仲裁,也完全可能从自私自利的盘算中产生。

例如一战期间产生的"自己活,也让他人活"的原则,德英两军在战壕战中遇到了3个月的雨季,双方达成了默契,互不攻击对方的粮车,约束自己不开枪杀人,只要对方也这么做。这个原则能实行的原因是,双方军队都陷入了困境,3个月时间给了他们相互适应的机会

人质困境:多人的囚徒困境

亚当-斯密在国富论中写道,当个人在追求私利的时候,市场的看不见的手会导致最佳经济后果,也就是说追求自身利益最大化的同时,也促进了社会公共利益的增长。

这种以个体利益最大化为目标的理性称为"个体理性"

然而,囚徒困境揭示了个人理性的选择与群体理性选择之间的矛盾,从个体利益出发的行为往往不能实现团体的最大利益。同时也揭示了市场理性本身的内在矛盾,从个体理性出发的行为最终不一定能真正实现个体的最大利益,甚至会得到相当差的效果。

可以证明,在人们的相互交往过程中,每个行为主体的利己主义决策结果,可能是有效率的,无效率的,但多次重复这种决策肯定是低效率的

混沌系统中的策略

酒吧博弈:有100个人很喜欢泡酒吧。这些人在每个周末，都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的，也就是说座位是有限的。如果去的人多了，去酒吧的人会感到不舒服。此时，他们留在家中比去酒吧更舒服。假定酒吧的容量是60人，如果某人预测去酒吧的人数超过60人，他的决定是不去，反之则去。这100人如何作出去还是不去的决定呢？

计算机模拟的结果是最终会形成一个稳定的生态,去酒吧的平均人数很快稳定到了60人,而真实人群的研究发现,去酒吧的人数呈现规律波浪形态

第i周 44人

第i+1周 76人

第i+2周 23人

第i+3周 77人

第i+4周 45人

第i+5周 66人

第i+6周 78人

......

传统经济学认为,经济主体的行动是建立在演绎推理的基础之上的,但事实并非如此,多数人的行动是基于归纳的,因此在酒吧博弈中,人们根据以往的历史来预测去酒吧的人数,那么历史人数就很重要了,然而过去的历史可以是"任意的",所以未来是不可确定的。股票买卖等问题都是酒吧博弈模型的延伸

酒吧博弈的现实启示:

1.从一个非线性系统的整体来说,其变化是不可预测的,要采取正确的决策,就必须了解其变化规律。

2.非线性混沌系统是一个无法完全了解的系统,我们无法知道哪里的量变会产生质变

3.处于混沌系统中的个体,在无法预测的过程中也可以采取恰当的策略,少数者策略是我们关注的重点

自牛顿以来,直线和简化的思想在我们的头脑中一直占据着主导地位,然而今年来,科学家发现,世界并不是那么简单,它并非是直线发展的,而是在关联和交互影响中进化的。也就是说世界上充满着各种不可预测的混沌。线性系统的整体等于部分相加,因此系统中每一部分都可以自由的做自己的事情而不需要关心其他部分。而在非线性系统中,整体并不等于所有部分相加,它可能大于所有部分相加,因为系统中一切都是关联的。

少数派策略

那么有没有可能对一个混沌系统进行干预呢,使其向我们期望的方向发生逆转?答案是肯定的,其中一种方法就是少数派策略。

例子:一个人发现村子里卫生状况非常差,每条街道都脏乱不堪,他想改变村民的习惯,却很难说服他们,他想了很久,最后买了一条很漂亮的裙子送给村里的一位小女孩。小女孩穿上裙子后,女孩的父亲发现她脏兮兮的双手和漂亮的裙子极不协调,就给她好好洗了个澡。但她父亲发现家里的脏乱环境把裙子弄脏了,于是父亲就发动家人把家里好好打扫了一遍,整个家都变干净了。很快这位父亲从干净的家里出来,门口满是垃圾的过道让人难受,于是他发动家人,将门口过道打扫了一遍,不就邻居发现隔壁的环境太令人舒服了,把屋里屋外都打扫了一遍,最后整个村子都变样了。

枪手博弈

彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好，十发八中；乙枪法次之，十发六中；丙枪法最差，十发四中。
第一个问题：如果三人同时开枪，并且每人只发一枪；第一轮枪战后，谁活下来的机会大一些？
一般人认为甲的枪法好，活下来的可能性大一些。但合乎推理的结论是，枪法最糟糕的丙活下来的几率最大。
我们来分析一下各个枪手的策略。
枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大，甲应该首先干掉乙，这是甲的最佳策略。同样的道理，枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉，乙和丙进行对决，乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些，丙先把甲干掉再与乙进行对决，丙的存活概率还是要高一些。我们计算一下三个枪手在上述情况下的存活几率：
甲：24％（被乙丙合射40％ X 60％ = 24％）
乙：20％（被甲射100％ - 80％ = 20％）
丙：100％（无人射丙）
通过概率分析，我们发现枪法最差的丙存活的几率最大，枪法好于丙的甲和乙的存活几率远低于丙的存活几率。

现在换一个玩法,三人轮流开枪,谁的机会更大?依然是丙

加入丙先开枪,他应怎么做?放空枪,只要不打破当前局面,他总是有利可图

博弈的2种形式:同时博弈,相继出招博弈

结论:多方博弈时,置身事外也是一种可考虑的选择

重复剔除劣势策略

例子:一次军事演习中,红方要用2个师的兵力,攻克蓝方占据的一座城市。而蓝方的防守兵力是3个师

条件1:红军与蓝军的师级部队战斗力相同

条件2:军队的最小单位为师

条件3:战争中都是易守难攻,兵力相同时,守方获胜

条件4:有2个方向可以发动进攻,分别是A方向,B方向

阶段1:

红方的进攻策略有3个

策略1: 2个师进攻A方向

策略2: 2个师进攻B方向

策略3: A,B方向各有1个师进攻

蓝方的防守策略有4个

策略1: 3个师集中防守A方向

策略2: 2个师防守A方向,1个师防守B方向

策略3: 2个师防守B方向,1个师防守A方向

策略4: 3个师集中防守B方向

经过分析可知: 蓝方有劣势策略,蓝方选择策略1比策略2差,因为策略1防不住红方策略3,同理蓝方策略4比策略3差。

根据理性博弈原则:绝不选择严格劣势策略,因此,蓝方策略可以简化,只剩下策略2和策略3。

阶段2:

剔除蓝方劣势策略后

红方的策略:

策略1: 2个师进攻A方向

策略2: 2个师进攻B方向

策略3: A,B方向各有1个师进攻

蓝方的策略:

策略1: 2个师防守A方向,1个师防守B方向

策略2: 2个师防守B方向,1个师防守A方向

这时,蓝方没有劣势策略了,但是红方反而出现了一个劣势策略,那就是策略3,此时,选择策略3,一定会失败。

再次剔除红方劣势策略后,红方蓝方都只剩下2个策略,此时各方的胜率都是50%

结论:红方兵力劣势与蓝方,但是胜率各是50%,在企业竞争中,也是一样。资本,规模,品牌,人力都处于劣势的企业,可以在某个局部市场上,集中自己所有的资源并整合,造成在细分市场上对强势企业的优势,从而成为市场竞争中的胜利者。

分享到：

<<博弈论>>归纳3 | <<博弈论>>归纳1

2016-06-22 12:52
浏览 603
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

<<博弈论>>归纳2

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

<<博弈论>>归纳2

评论

发表评论

相关推荐

流程经验总结

业务流程自动化实践--自动发送模板邮件

《OKR工作法》归纳

项目方法论(微观)

宏观方法论

《流程圣经》归纳2

<<社会契约论>>归纳

《论自由》归纳

《小艾上班记》归纳2

《小艾上班记》归纳1

《ERP：从内部集成开始》归纳

软件系统实施方法论总结

一些杂想6

<<经济学原理>>归纳

<<流程圣经>>归纳1

天云悖论

一些杂想5

<<王二的经济学故事>>归纳

<<信号与系统>>小结

<<控制论与科学方法论>>归纳

最近访客更多访客>>