什么是子博弈纳什均衡

什么是子博弈纳什均衡

子博弈精炼纳什均衡(Subgame Perfect Equilibrium,SPE)是一种应用于“动态博弈”(或“序贯博弈”)的、比纳什均衡更“严格”的均衡概念。它要求在博弈的每一个“子博弈”(也就是从任意节点开始往后看所形成的完整博弈场景)中,参与者所采用的策略组合都是一个纳什均衡。这样做可以排除“空头威胁”、不可信的承诺等非理性因素,使得均衡更具可信度。

1. 为什么要强调“子博弈”?

在一些带有先后顺序的博弈(例如领导者—跟随者模型、要约谈判、拍卖等),玩家会根据之前的历史行动进行决策。若只用纳什均衡来分析,可能会出现“不可信威胁”或“无意义承诺”的情况:

​ • 举个例子,有时一方可能为了在前期占到便宜,而声称“若你不按我的条件来,我就做出对大家都不利的极端行为”,然而这种极端行为在后面实际并不符合他的利益,属于“空头威胁”。

​ • 普通纳什均衡并不排除这类不可信策略组合,但子博弈精炼纳什均衡通过“在每个子博弈中都得是纳什均衡”的要求,剔除了这些不可信的威胁与承诺。

2. 直观理解

​ • 子博弈可以理解成“在博弈某一阶段往后看的完整局面”,包括后续所有可能的决策与结果。

​ • 子博弈精炼就是在博弈进行到任何一个阶段时,玩家都不会选择“前后不一致”的策略:一旦进到某个阶段,他们在那个阶段之后所使用的策略,也要对所有人都是“局部最优”,并且彼此的策略要形成纳什均衡。

也就是说,不管博弈发展到什么时点,看后面的游戏都能在那个子博弈里形成纳什均衡;否则就是玩家在事后不会真的采用某些“威胁”或“承诺”,从而这种策略组合就不会是子博弈精炼纳什均衡。

3. 举个例子:最后通牒博弈

​ • 场景:A和B要分一笔钱,A先提出一个分配方案,如果B同意,就按该方案分配;如果B不同意,那么双方都得不到任何东西。

​ 1. 如果只考虑纳什均衡,A可能威胁说“B要是不接受,就都别想得到钱”。

​ 2. 但是在子博弈精炼纳什均衡的分析中,我们用逆向推理(Backward Induction)

​ • 在最后阶段,如果B拒绝,大家都得不到任何钱,那么对B来说,只要A给他“大于0”的分配,B就会理性地同意,因为再小也是好过“不接受什么都没有”。

​ • 因此A知道B一定会接受一个稍大于0的提议,于是A会出一个“略高于0”给B,自己留下绝大部分。

​ • B也没有再谈判的回旋余地,只能接受这个“略高于0”的提案。

​ 3. 这个由逆向推理得到的策略组合,就是子博弈精炼纳什均衡:在博弈最后的子博弈里,B理性地接受任何大于0的提议,A则按照这个预期来提出分配。

​ • 子博弈精炼纳什均衡是对纳什均衡的强化,它要求:在博弈的每一个阶段(也就是子博弈)中,所有人的策略组合都必须形成一个纳什均衡。

​ • 这一要求可以排除“威胁不可信”、“承诺不可信”等情况,使得在动态决策的分析中更为合理。

​ • 寻找子博弈精炼纳什均衡常用方法就是逆向归纳(Backward Induction),尤其在有限阶段的序贯博弈里非常常见。

简单来说,如果你想确保你在整个动态博弈过程中的策略,从头到尾在各个阶段都很“自洽”,那最终形成的结果就是一个子博弈精炼纳什均衡