85、纳什均衡

在博弈论中有一个很重要的概念称为纳什均衡,它使博弈论真正成为经济学的基础,在分析经济学现象中纳什均衡是基础而重要的工具。在n个理性人的博弈过程中,如果任何一个人都无法通过单独改变策略获得额外的收益,就称这种状态为纳什均衡。纳什应用严格的数学方法证明,在n个人的博弈过程中,纳什均衡是普遍存在的。

纳什均衡有一个简单而著名的例子,就是囚徒困境。两个小偷作案时被抓获,并在两个不同房间内审讯。规则是:如果两个人都坦白,则各判8年;一个坦白一个抵赖的话,坦白者可立即释放而抵赖者判10年;若两个人都抵赖,则因证据不足构不成偷窃罪,只能以私闯民宅各判1年。在理性人的前提下,每个人都会选择坦白,各判8年,这种状态正好构成纳什均衡。但是我们知道,存在对他们更有利的方案,那就是相互合作,共同抵赖,从而各判1年。纳什均衡告诉我们,处在纳什均衡点上的状态并不一定是对所有人最有利的方案,但是,现实的经济社会中却到处存在着纳什均衡状态。

囚徒困境的例子一方面告诉我们,理性经济人的假设是合理的,现实生活中存在大量纳什均衡的例子,大多数人都会从自身利益出发,选择那条对自己最有利的决策,从而形成一种均衡稳定的社会状态,在这种状态中,每个人都不愿改变,因为现有的状态就是自己通过不断试验、选择、决策而能够达到的最好状态,改变现状很可能会损害自己的利益,使自己处在糟糕的环境之中。另一方面,囚徒困境告诉我们,理性的不一定是正确的,这种纳什均衡状态可能并不是最好的,很有可能会有更好的系统状态,在新的状态下至少部分人可能会获得比纳什均衡更多的收益。

一个一成不变的圈子里,一般可以认为是处在纳什均衡之中。我们每天上学放学或者上班下班,两点一线、吃饭睡觉、忙忙碌碌,窗外的马路上车水马龙、川流不息。我们自以为是自由的,但是如果跳出生活环境,以一个旁观者的身份观察平日里的自己和周围的社会,会发现我们就像一个上了发条的钟表一样的活着,时针、分针、秒针严丝合缝、一丝不苟的工作着。偶尔,我们会抱怨一下,感叹生活的枯燥,并试图去改变一下,但是稍作改变后马上被打回原形,老老实实的回到原来的生活轨迹上,因为我们发现改变会损害自己现有的利益。

我们可以把纳什均衡想象为一张很大的橡皮膜上有很多不同重量的小球,每个小球可以代表一个理性人,理性人的追求是获得尽可能低的位置,位置越低代表利益越大。当系统稳定时,每个小球由于重力都处在一个凹陷的位置底部,某个小球想改变现有的状态,但是他发现无论朝哪个方向努力,都会使自己位置变高,利益受损,因此每个小球都不动,系统处在纳什均衡的稳定状态之中。

如果我们想获得一个更好的环境应该怎样做呢?一种可能可以从囚徒困境中看到:两个小偷彼此合作。但是趋利避害,实现利益最大化是所有生物的共性,是亿万年进化的结果,那些对生物有害的行为方式大都在进化过程中淘汰了,就像叶子伸向阳光、根系偏向水肥、草履虫游向营养物质。即使小偷们通过理性选择合作,也会像物理学的激发态或亚稳态一样不会长久,某个小偷会为了更大的利益出卖队友,连1年的囚徒也不想坐,让自己无罪释放,把10年牢狱之灾丢给队友。

那么有没有其它的可能改善局面呢?有的。纳什证明了稳定的纳什均衡普遍存在,但并不代表纳什均衡解是唯一的,只有在非常强的约束条件下,纳什均衡才可能有唯一的解。这样,即使在相同的环境或游戏规则下,纳什均衡也不是唯一的,而是有很多可能的解。如果将每一个纳什均衡解看作系统的一种相态,那么纳什均衡间的转变则相当于一种相变。

如果橡皮膜上的部分小球跳出凹陷部位,则牵一发而动全身,使系统发生相变,从一种状态转换到另一种稳定状态,膜上的小球将重新分布,建立新的纳什均衡。当然,还有其他的方式建立新的纳什均衡,那就是改变游戏规则或者外界环境。而改变外界环境同样可以实现状态的改变,比如可以通过科技的力量解决现有的资源与能源问题。当我们将无用的沙子转变为手机芯片,从铁矿石中炼出钢铁,从矿物或石油中转化出化工产品时,低价值的东西变成对人们更有用的高价值物品,总财富增加了。在这样的变化中,每个人都可能获益。

在这些改变纳什均衡的方法之外,还有一种可能,那就是“超理性”。小偷之间理性的合作是建立在利益的基础之上,因此是一种脆弱的联盟。然而有一类人能够预见到长远的未来,从而可以在短期利益与长远利益之间做出正确的选择。在常人看来,他们选择了损害自己利益的傻瓜决策,而他们自己则很清楚,他们的那些在常人眼中的非理性行为,实际上正是理性经济人的最正确的选择。