智猪博弈与重复剔除劣势策略

智猪博弈说的是,有两头非常聪明的猪(要不怎么叫“智”猪呢),一大一小,共同生活在一个猪圈里。猪圈的一端有一个踏板,踏板连着开放饲料的机关,只要踏一下,在猪圈另外一端的食槽就会出现10个单位食物。经过精确的衡量,任何一头猪去踏这个踏板都会付出相当于2个单位食物的成本;每只猪都可以选择“踏”或“不踏”踏板。如果:

·两只猪一起去踏,然后一起回槽边进食,则大猪由于食得更快可吃下8个单位食物,小猪只能吃到2个单位食物,扣除各自的成本,大猪实际赢利6个单位食物,小猪则赢利0个单位食物;

·若大猪去踏,小猪先等候在食槽边,则大猪因时间耽搁只食得6个单位食物,小猪食得4个单位食物,大猪扣除成本后赢利4个单位食物,小猪没有成本因而赢利也为4个单位食物;

·若小猪去踏,大猪先候在槽边,则当小猪赶到槽边时大猪已经吃光了10个单位食物,小猪不仅什么都没吃到,反而还付出了2个单位成本;

·两只猪都不去踏,则大家都只能得到赢利0。

该博弈的赢利表如图4-1所示:

图4-1 智猪博弈

观察这个博弈可以发现:小猪有优势策略——无论大猪踏不踏,小猪选择不踏总是最合适的。(道理很简单:若大猪踏,则小猪踏得0,不踏得4;若大猪不踏,小猪踏得-2,不踏得0;即任何情况下均是不踏更好)。但是大猪没有优势策略,因为大猪的策略将随小猪策略的改变而改变,若小猪踏则大猪最好不踏(大猪踏得6,不踏得10),若小猪选择不踏则大猪最好选择踏(大猪踏得4,不踏得0)。

那么,这个博弈的稳定结果将是哪种情况呢?不妨这样考虑,既然不踏是小猪的优势策略,踏就是小猪的劣势策略。而劣势策略是参与人永远不会选择的,相当于小猪的策略集合里从来没有考虑过“踏”这一选项,因此可以把“踏”这个策略从小猪的策略集合中剔除。于是小猪只剩下唯一一个策略“不踏”。剔除劣势策略“踏”之后的赢利表就从图4-1变化为图4-2的形式:

从图4-2中可以发现,在这个简化后的博弈中,对于大猪而言,踏是一个优势策略,而不踏是劣势策略。因此,我们可以继续剔除大猪的“不踏”策略,于是图4-2的简化博弈进一步简化成图4-3的形式:

图4-2 智猪博弈(第一轮剔除劣势策略)

图4-3 智猪博弈(第二轮剔除劣势策略)

经过第二轮剔除,我们得到了一个唯一的策略组合(踏,不踏),即大猪选择踏,小猪选择不踏。这个唯一的组合代表了它们策略行为唯一可收敛的情况,是一个稳定的结果。这种不断剔除劣势策略的方法,叫重复剔除劣势策略,所得到的稳定结果叫重复剔除劣势策略纳什均衡。

剔除劣势策略的一个重要前提思想是:理性的人永远不会选择其劣势策略。

智猪博弈深刻地反映了经济和社会生活中的免费搭车问题。无论大猪踏不踏,小猪都选择不踏(这是它的优势策略);给定小猪不踏,大猪最好去踏。而且,有意思的是,大猪选择踏在主观上是为了自己的利益,但在客观上小猪也享受到了好处。这正是亚当·斯密“看不见的手”原理的一个童话版。看不见的手原理的意思是:社会上每个人为了自己的利益而采取行动,但这些行动在客观上也为社会上其他的人带来了好处。在经济学里,这头小猪被称为“搭便车者”。若全部的博弈主体都试图免费搭车,那么就可能陷入囚徒困境。在本章的前言中,弄堂两旁的居民好比是“小猪”,“小猪”没有动力去修路。后来,有了学校这头“大猪”介入,于是修路的重任就落到了学校这头“大猪”身上,当然那些作为“小猪”的居民也得到了好处。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.iqinshuo.com/5942.html