动态博弈:在前一刻最优的决策,在下一刻可能不再为最优
有这样一个故事,五个海盗抢得100枚金币,他们决定:
(1)抽签决定各人的号码(1,2,3,4,5)。
(2)由1号提出分配方案,然后5人表决,当且仅当超过半数同意时,方案通过,否则他将被扔入大海喂鲨鱼。
(3)1号死后,由2号提方案,4人表决,当且仅当超过半数同意时,方案通过,否则2号同样被扔入大海。
(4)以此类推……
假定每个海盗都是很聪明的人,都能很理智地判断得失,从而作出选择,那么1号提出怎样的分配方案才能够使自己的收益最大化呢?
问题的答案是:1号独得97块金币,不给2号,给3号1块,给4号或5号2块。可以写成(97,0,1,2,0)或者(97,0,1,0,2)。
1号这样做不是找死吗?不怕被其他人扔到海里去吗?事实上,这个方案是绝妙的。因为这5个海盗都是绝顶聪明的。
首先来看4号和5号是怎么想的:如果1号、2号、3号都喂了鲨鱼,只剩4号和5号的话。无论4号提出怎样的方案,5号都一定不会同意。因为只要5号不同意,就可以让4号去喂鲨鱼,那么自己就可以独吞全部金币。4号预见到这一结局,所以打定主意,不论怎样,唯有支持3号才能保命。而3号知道,既然4号的赞成票已在手中,那么就会提出自己独得100块金币的分配方案,对4号、5号一毛不拔。不过,2号料到3号的方案,他会提出(98,0,1,1)的分配,不给3号,给4号和5号各1块金币。因为这样对4号和5号来说比在3号分配时更有利,于是他俩将转而支持2号,不希望他出局。但是,1号比2号更占先机,只要他得到3票赞成,即可稳操胜券,如果他给3号1块金币,给4号或5号2块金币——这肯定要比2号给得多,那么,除了他自己的1票之外,他还能得到3号以及4号或5号的支持。这样他将不会被丢到海里去,并且还将拿到97块金币!
这个看起来似乎是自寻死路的方案实际上非常精确。其前提在于,五个强盗个个工于心计,能够准确地预测分配过程中每一步骤将会发生的变化。而且全都锱铢必较,能多得1块金币就绝不少得,能得到1块金币也绝不放弃。这是一场精彩的博弈。
上述海盗分金的故事其实就是一场动态博弈。动态博弈指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人会采取什么行动。
动态博弈的困难在于,在前一刻最优的决策,在下一刻可能不再为最优,因此在求解上发生很大的困难。动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择。因此,为了做最优的行动选择,每个参与人都必须这样思考问题:“如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?”
在动态博弈中,每个局中人的举动显然是先根据对方的行动作出的,就如下棋一样,你走一步,对方走一步,行动策略上有一个先后顺序,这就大大地给了被动方反被动为主动的余地。
历史上著名的请君入瓮的故事也是动态博弈的经典实例。来俊臣问周兴说:“囚犯多不肯招认,应该采取什么办法?”周兴说:“这太容易了!抬个大瓮来,用炭火在四面烤,再叫犯人进到里面,还有什么能不招认!”于是来俊臣立即派人找来一口大瓮,按照周兴出的主意用火围着烤,然后站起来对他说:“有人告你谋反,太后让我审查你,请老兄自己进到瓮里吧!”周兴大惊失色,只得叩头认罪。
众所周知,再精明的对手也会有猝不及防的死穴。在生活中,难免有遭遇小人之时,聪明人总是能够对自己的行动适时作出调整,化险为夷。