前言:
此刻兄弟们对“进化稳定策略与纳什均衡”都比较关注,同学们都需要剖析一些“进化稳定策略与纳什均衡”的相关文章。那么小编在网上汇集了一些对于“进化稳定策略与纳什均衡””的相关知识,希望你们能喜欢,咱们快快来学习一下吧!上一期讲帕累托最优,我们举了囚徒困境的例子。
在这个例子里还涉及到另一个经济常识——纳什均衡。
在囚徒困境中,两个理性的囚犯都选择背叛对方,因为这是在考虑到对方可能的选择后,做出对自己最有利的策略。
这个选择构成了纳什均衡,因为在这个情境下,没有一个囚犯能通过改变自己的选择(从背叛变为合作)来获得更好的结果。
囚徒困境和我们开车加塞的情况很像。
开车行驶在交通拥堵的下班路上,如果大家都不加塞,是整体的最优解,大家都按自己的路线,规规矩矩地跟着前车走,就不会造成大面积拥堵。
但是按照纳什均衡理论,任何一个司机都会考虑,无论别人是否加塞,我加塞都可以使自己的收益变大,我就可以走到别人前面,减少我在路上的行驶时间。
于是最终大家都会加塞,左右突击,钻各种空子,这样极容易造成擦挂等事故,交通反而乱成一团,拥堵加剧,还不如大家都不加塞走的快。
每个人都认定无论别人加不加塞,自己加塞就是最优解。这种个人理性导致了集体的不理性。
所以纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。
01什么是纳什均衡
纳什均衡由美国数学家约翰·福布斯·纳什在20世纪50年代提出,也是博弈论的重要概念。
简单地说,就是多人参加的博弈中,每个人根据他人的策略制定自己的最优策略,所有人的这些策略组成一个策略组合,在这个策略组合中,没有人会主动改变自己的策略,因为那样会降低他的收益。只要没有人作出策略调整,这个时候,所有参与者的策略便达成了一种平衡,这种平衡便是纳什均衡。
举个例子:
有一个学校规定:一个班排名前十的学生有奖金。
考试前夕,全班同学商量一起交白卷,这样就不用挑灯夜战复习、心惊胆战担心名次,全班分数都一样,不分高低,都可以拿奖学金。
但是,考试结果出来后,却没有一个人交白卷,大家都心照不宣。
虽然考试前商量了都交白卷,但是不能保证某些人做了一道选择题或填空题,就获取到了最大利益,成了全班第一,每个人都想到了这点,每个人都想争取自己利益最大化,成为那个全班第一。
于是就出现了没有一个人交白卷的情况。
可见,个人的理性选择并没有导致全局的最佳结果。纳什均衡体现的是个人最优,而不是集体最优。
说到纳什均衡不得不提一下它的发明者——约翰·福布斯·纳什。
经典影片《美丽心灵》就是根据他的事迹改编而成的,2001年一上映便获得8项奥斯卡提名,让这位科学家走进人们的视线。
纳什出生于1928年的美国西弗吉尼亚州,家庭条件优越,父亲是工程师,母亲是教师。
纳什小时候性格孤僻,喜欢在读书中寻找乐趣,他很有数学天赋,老师用一黑板证明的定理,他只需要几步便可完成,时常会让老师感到尴尬。
1948年,纳什同时被四所大学录取,他最终选择了普林斯顿。因为那里学术风气非常自由,云集了爱因斯坦、冯.诺依曼等一批世界级的大师,是世界的数学中心。
1958年,《财富》杂志评选纳什为数学家中杰出的明星,不到30岁就成了闻名遐迩的数学家。
之后他患"妄想型精神分裂症”,因病情不断加重而失去工作。
1970年,纳什的母亲去世,当他面临着露宿街头的困境时,已经离婚的妻子接收了他,在妻子的精心照顾下,到20世纪80年代,纳什病情好转,并最终康复。
1985年,纳什成为诺贝尔经济学奖的候选人,1994年获得诺贝尔经济学奖。
2015年5月24日,纳什与妻子在美国新泽西州因车祸双双遇难,结束了自己传奇的一生,享年86岁。
02纳什均衡与帕累托最优的区别
帕累托最优和纳什均衡都描述了一种理想状态,但它们的侧重点不同。
帕累托最优关注的是效率和最优的资源分配,而纳什均衡关注的是参与者行为的稳定性,即在当前策略下,没有人有动机改变自己的选择。
纳什均衡并不一定是帕累托最优的。这是因为在纳什均衡状态下,虽然每个参与者的策略都是对其他人策略的最佳响应,且没有人愿意单独改变自己的策略,但这并不意味着资源分配是最有效率的。
纳什均衡可能反映了一种战略平衡,而这种平衡可能导致资源利用不是最优化的情况。换言之,纳什均衡可能是“稳定”的,但不一定是“最好”的。
例如,在囚徒困境游戏中,两个理性的囚犯都选择背叛对方,因为这是在考虑到对方可能的选择后,对自己最有利的策略。这个选择构成了纳什均衡,因为在这个情境下,没有一个囚犯能通过改变自己的选择(从背叛变为合作)来获得更好的结果。
然而,如果两个囚犯都选择合作,他们的总刑期会更短,这将是一个帕累托最优的结果,因为它能让双方都处于更好的状态,而不会损害任何一方。
但由于互不信任和战略的限制,他们未能达到这一帕累托最优状态。
反之,一个帕累托最优的状态不一定是纳什均衡。如果一个经济体中的资源分配能够重新安排以提高一个人的福利而不损害其他人,那么这个分配是帕累托最优的。
然而,如果这种重新分配需要某些个体自愿放弃自己的资源,而这种放弃并不符合他们的个人最优策略,则该状态可能不会自发实现,因为每个个体在没有外部激励或强制的情况下,都没有动机改变自己的策略。
03个人与纳什均衡的关系
有一个农夫,在杀鸡之前的晚上,不经意地说:“快吃吧,这是你的最后一顿!”
第二天,农夫见鸡已躺倒并留下遗书:“爷已经吃下老鼠药,你们别想吃爷了,爷TM也不是好惹的。”
这个例子告诉我们:当对手知道了你的决定后,就能做出了对自己最有利的决定。
鸡在死前的晚上找到了自己的纳什均衡点。
再举个离婚的例子。
一对夫妻,在婚姻走到尽头要离婚的时候,一般情况下是要分割财产的。这时候,就是一个博弈的过程。如果是合作博弈,也就是两个人好商量,那么就去协议离婚,民政局领离婚证,财产一人一半,谁也不吃亏。
但是,如果走法院起诉离婚的路线,则是非合作博弈,这个时候要请律师,而且财产分割就会有人吃亏有人占优势。
那么,我们假设夫妻共同财产是100万,如果女方请律师,上法院起诉离婚,那么女方要付出律师费4万,但可以分得70万财产。
男方如果不请律师,那么男方只得到30万。这个情况下,男方其实是吃亏了。
所以,这个不是纳什均衡——所谓均衡就是无法再改进了。
那么男方应该怎么做?
当然是要改进,那就请律师,男方付出律师费4万,这个时候双方上了法院,最后律师势均力敌,双方每人分得50万财产,除了律师费用,每人剩46万。
这时,每人46万就是纳什均衡。
从上面的例子可以看出,如果两个人都不请律师,每人可以分得50万,这是一种合作博弈状态下的纳什均衡。
然而双方并没有不请律师的共同约束,一方知道如果另一方不请律师,而自己请律师的话肯定分得更多,那么TA一定会请律师。所以,这个状态不是一个纳什均衡——因为有一方可以通过改进策略多赢钱。
所以,非合作博弈的纳什均衡状态一定是双方都请律师,这样谁也不吃亏——离婚双方分得一样的财产,而律师也赚了钱,律师在离婚官司里得到了纳什均衡的好处。
纳什均衡理论指出,合作是有利的“利己策略”。它必须符合以下黄金律:按照你愿意按照别人对你的方式来对别人,只有他们也按同样方式行事才行。
有没有办法使个人最优变成集体最优呢?
方法就是共谋。囚徒困境中的两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。
也就是说,在多次博弈过程中,共谋是可能的。但是如果这个小偷想干完这一票就走,共谋就是不牢靠的。
在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。
标签: #进化稳定策略与纳什均衡