理性、进化与均衡——博弈论解概念及其基础
丁利
【关键词】博弈论 解概念 基础 理性 进化 均衡
【全文】
理性、进化与均衡——博弈论解概念及其基础
北京大学法学院法律经济学研究中心 丁利
自然比人类更早,而人类比自然科学更早
——Von Weizsacker
引子
在《从惊讶到思考——数学悖论奇景》中,描写了一个梵学家的女儿苏珊和父亲打赌的故事。苏珊认为父亲并非能够预测未来所有事情,梵学家不服。于是苏珊说,有一件事,我写在我的纸上。如果你预测它能发生,你就在你的纸上写个“是”,否则你就写个“不”。我们第二天看你预测的对不对。梵学家愉快地答应了。但第二天作父亲的却傻眼了,因为苏珊写的是“你在纸上写的是个不字”,而梵学家写的是个“是”字。不过他马上发现自己被女儿愚弄了,因为如果写个“不”字,那么苏珊说的刚好是这件事,他应该写个“是”字,所以怎么都不对。
这个打赌——博弈的故事实际上可以看作是说谎者悖论的另一种形式。正如我们所知道的,所有的悖论都可以转化为一个关于不完备性的证明。那么,与元数学(meta-mathematics)——证明论(proof theory)中著名的哥德尔不完备性定理 联系起来,我们会发现逻辑学和博弈论之间的一种什么样的关联呢?博弈论学者能避免梵学者的尴尬吗?或者,换句话说,如果这种尴尬是不可避免的,那么博弈论是如何应对从而为其合法性找到辩护理由的呢?
探讨博弈论基础的工作几乎不可避免地要与数学基础联系起来。今天的博弈论思想已渗透到纯数学如数理逻辑中了。二者之间有着许多形式上的相似,如逻辑中的公理系统与其解释——即模型(model)之间的关系,可以看作是一种博弈;博弈论的纳什均衡解在数学上表现为一个不动点,哥德尔定理中自指自己在系统里不可证的不可判定命题也是一个不动点 。而模态逻辑(modal logic)作为研究博弈论的知识论基础的标准工具,它与证明论有着本质上的联系。几乎所有的博弈都可以看作一个动力系统或用动力系统模拟,而源于数学基础研究的图灵机(turing machine)以及冯诺依曼提出的元胞自动机(cellular automata )则是动力系统理论的基础。那么,元数学的观念能否给我们提供理解博弈论及其解概念的洞察力?
博弈论 作为关于“理性人的互动(interaction)行为”(Aumann,1985,p35)的理论,借助以纳什均衡(equilibrium)(Nash, 1951)为核心的博弈解概念,已经发展成为分析二人以上社会中人们理性决策的行为选择模式的标准工具。在现代经济学尤其是微观经济学的发展中,博弈论已经占据了核心地位,并在深度和广度上继续取得巨大突破和惊人进展 。
博弈论作为研究者的数学建构,它能够取得成功,除了其内在逻辑上的简洁、和谐与质朴的美感,还应源于它的解概念为我们描述现实提供了具有直觉洞察力的观念。那么,在什么意义上,博弈论不仅是一种人类智力的构造,还是一种具有现实描述力的“社会物理学”?
任何一个严肃的博弈论学者都不会对此问题视而不见 。最近二三十年博弈论基础方面的发展,主要在这样几个方向上,在纳什均衡的弱化(generalization或extension)和精炼(refinement)的两个方面对解概念(solution concept)进行拓展,对解概念的知识论(epistemic)基础的探讨,博弈中的进化(evolution)和学习(learning)理论以及它们对解概念正当性(justifiability)的证明,实验经济学对各种博弈论结论的验证,在更弱理性假设上的个人理性决策理论以及基于此的博弈解概念。这些进展足以使我们能够对此问题勾勒出一个大致的轮廓 ,本文正是试图通过对博弈论发展进程中的这些重要工作的综览、总结和整理 ,讨论博弈论的基本解概念的合理性,其隐含的逻辑基础和知识论假设,这些前提条件及其推论与现实世界的关系,进而探讨博弈论未来的可能发展。
我们的所有介绍和评述都建立在两个观念之上。首先,从一个形式化的理论系统的一致性(consistency)方面。在博弈者知道整个博弈模型的隐含假设下,纳什均衡及其精炼,是“一个解概念应该是自我实施(self-enforcement)的”这样一个观念的必然结果;这个自我实施的观念,在纳什均衡或者它的弱化与加强中,反映了各种各样的重要的思想和直觉。这些解概念,在知识论意义上,要求博弈者具备相应的知识和信念(信息结构);通过对博弈论解概念的知识论分析,本身与数理逻辑特别是模态逻辑以及理论计算机科学的发展交织在一起,并且可能引申出更多有独立价值的结果。
其次,从研究者的理论建构与其描述对象的关系方面。由于这些信息结构的要求很强,它们更确切地应该被看作是研究者的构建。那么这种建构如何能与现实联结起来呢?如果我们把所有行动看作是两种行动的叠加,即均衡行为与趋向均衡的行为。那么很强的信息结构指引下的均衡行为模式可以通过在模型中满足种种稳健性(robustness)和稳定性(stability)的要求以非均衡行为来近似地逼近。通过进化博弈和动力系统理论以及随机过程(与统计力学有关)中的长期(long-run)稳定行为或大范围统计结果,我们试图表明,博弈者“好像是(as if)”理性地选择均衡策略行为。
博弈者、研究者与观察者:理论模型与描述对象
博弈论首先是一门数学。“贝奈斯说得好,数学是研究可能的理想化结构的,那些结构可以在也可以不在物理世界中存在,也就是获得实现”(王浩,350)。易言之,数学是研究可能世界的,是为其它学科提供模式(pattern)的;作为经济学的博弈论,正如物理学一样,其研究者的使命是选择恰当的模式来描述现实(物理)世界 。
元数学的根本观念在于区分了系统外和系统内 看问题,并尝试探讨一个理论能否成为自身的元理论 。把从元理论(或者客观观察者(observer))的角度看作为一个原则,我们严格区分研究者(researcher)和他的理论(通常所谓的模型 )与理论对象(现象和事实) 。对于博弈论学者来说,他参与的是一个研究者与研究对象之间的博弈(正如那个不幸的梵学家)。显然,现实世界的行为(纯策略)是无穷无尽的,而研究者的行为集合是各种各样的数学模型。不用说,研究者没有一个永远取胜的策略。但我们可以探究的是,研究者可采取的尽可能好的策略。