唯一纯策略纳什均衡博弈的有限次重复博弈

首先容易理解的是，如果原博弈的唯一的纯策略纳什均衡本身就是帕累托效率意义上的最优策略组合，那么因为符合所有博弈方的利益，因此有限次重复显然不会改变博弈方的行动方式。我们最关心的当然不是这种博弈，而是原博弈唯一的纳什均衡没有达到帕累托效率，因此存在通过合作进一步提高效率的潜在可能性的囚徒困境式博弈，在有限次重复博弈中能不能实现合作和提高效率的问题。

1.有限次重复囚徒困境博弈

下图所示的是囚徒困境博弈，考虑两次重复该博弈。

我们用逆推归纳法来分析该重复博弈，先分析第二阶段，也就是第一次重复时两博弈方的选择。这个第二阶段仍然是一个囚徒困境博弈，此时前一阶段的结果已是既成事实，此后又不再有任何的后续阶段，因此实现自身当前的最大利益是两博弈方在该阶段决策中的唯一原则。因此我们不难得出结论，不管前一次博弈的结果如何，第二阶段的唯一结果就是原博弈唯一的纳什均衡（坦白，坦白），双方得益（-5，-5）。

现在再回到第一阶段，即第一次博弈。理性的博弈方在第一阶段就对后一阶段的结局非常清楚，知道第二个阶段的结果必然是（坦白，坦白），双方得到（-5，-5）。因此不管第一阶段的博弈结果是什么，双方在整个重复博弈中的最终得益，都将是在第一阶段得益的基础上各加-5。因此从第一阶段的选择来看，这个重复博弈与下图中得益矩阵表示的一次性博弈实际上是完全等价的。该等价博弈仍然有唯一的纯策略纳什均衡（坦白，坦白），双方的得益则为（-10，-10）。这意味着两次重复的囚徒困境博弈的第一阶段结果与一次性博弈也一样，最终两次重复囚徒困境博弈仍然相当于一次性囚徒困境博弈的简单重复。根据上述分析方法，我们同样可以证明3次、4次，或者n次重复囚徒困境博弈的结果都是一样的，那就是每次重复都采用原博弈唯一的纯策略纳什均衡，这就是这种重复博弈唯一的子博弈完美纳什均衡路径。

2.一般结论

事实上，上述结果是具有一般意义的。原博弈有唯一的纯策略纳什均衡，则有限次重复博弈的唯一均衡即各博弈方在每阶段（即每次重复）中都采用原博弈的纳什均衡策略。

定理：设原博弈G有唯一的纯策略纳什均衡，则对任意正整数T，重复博弈G（T）有唯一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G（T）中的总得益为在G中得益的T倍，平均得益等于原博弈G中的得益。

3.重复囚徒困境悖论和连锁店悖论

在重复的囚徒困境博弈的大量实验研究中，重复次数较大时的实验结果通常与上述理论结论不同，包含合作的情况非常普遍。其实，有限次重复的囚徒困境博弈的问题，与动态博弈中的蜈蚣博弈都是相似的，问题的症结都在于，在较多阶段的动态博弈中逆推归纳法的适用性受到了怀疑。

相关推荐