主题：【文摘】理性与有限理性:论经典博弈理论与进化博弈理论之关系 -- snowbean

共:💬2 🌺1 新:

经济管理

分页树展主题 · 全看

家园 【文摘】理性与有限理性:论经典博弈理论与进化博弈理论之关系
理性与有限理性:论经典博弈理论与进化博弈理论之关系
内容摘要：本文以理性与有限理性为线索，主要介绍进化博弈理论（Evolutionary Game theory）与经典博弈理论(Game theory)的区别与联系。在指出经典博弈理论的缺陷以后，本文进一步给出进化博弈理论产生的必要性及可能性，并给出了进化博弈理论的基本概念-进化稳定策略的定义。最后一部分把两种理论进行了进一步的对比。
关键词：理性；有限理性；进化稳定策略；纳什均衡
Rationality；Bounded Rationality；Evolutionarily Stable Strategy; Nash Equilibrium
英文标题：
Rationality and Bounded Rationality
---On the Relationship of Classic Game Theory and Evolutionary Game Theory
作者简介：
张良桥冯从文
摘要：
本文以理性与有限理性为线索，主要介绍进化博弈理论（Evolutionary Game theory）与经典博弈理论(Game theory)的区别与联系。在指出经典博弈理论的缺陷以后，本文进一步给出进化博弈理论产生的必要性及可能性，并给出了进化博弈理论的基本概念-进化稳定策略的定义。最后一部分把两种理论进行了进一步的对比。
引言
进化博弈理论至少自二十世纪六十年代生物学家们用于解释生态现象就已经产生了，特别是 Maynard Smith and Price(1973)及Maynard Smith(1974)提出进化稳定策略（Evolutionarily Stable Strategy,ESS）这一基本概念以后，该理论逐渐被广泛地用于生态学、社会学、经济学等领域。 1992年关于进化博弈理论的国际学术会议在康奈尔大学的召开正式确定了它在经济学上的学术地位，此后进化博弈理论在经济学上的应用得到迅速的发展，越来越多的经济学家应用该理论来研究经济活动中经济主体的群体行为。与经典博弈理论不同，进化博弈理论并不要求经济主体是完全理性的，也不要求经济主体的行为满足预期一致性原则。因此进化博弈理论比经典博弈理论能够更准确地预测经济主体的行为，所以在短短的二十几年里进化博弈理论就获得了迅速的发展。本文主要介绍进化博弈理论的发展、基本内容及其与经典博弈论的区别。
一、经典博弈理论的困惑
进化博弈理论与经典博弈理论既存在很大区别又存在一定联系。经典博弈理论从完全理性的参与人出发，利用其经典均衡概念――纳什均衡来预测参与人的行为。然而，当系统存在多重纳什均衡时，经典博弈理论无法给出令人满意的答案。进化博弈理论从有限理性的参与人出发，利用动态分析方法来考察系统达到均衡的过程，并利用该理论的均衡概念――进化稳定均衡来预测参与人的群体行为。在多数情况下，进化博弈理论比经典博弈理论能够更好地预测参与人的行为。这两个理论虽然存在着重大的区别，但如果用进化博弈理论中参与人群体来代替经典博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体个体总数的百分比来代替经典博弈理论中的混合策略，那么这两种理论就达到了形式上的统一。在这一部分我们主要论述进化博弈理论与经典博弈理论的区别与联系。
古典经济学假定参与人是完全理性的，即作为生产者在给定技术和资源条件下能够找到一个可以获得最大利润的生产方案；作为消费者在既定的预算约束下能够找到一个可以获得最大效用的消费方案。经典博弈理论则在此基础上引入了经济行为主体之间的互动作用，从而使得理论与现实更接近，但还是没能跳出古典经济学理论的基本框架，它作为预测经济主体行为的基本工具是纳什均衡 ④及其精炼。在预测经济主体行为时，经典博弈理论存在着三大缺陷：
（1）在作均衡分析时，经典博弈理论假设参与人是完全理性的，并且每个参与人对博弈的结构及对方的支付有完全的了解（完全信息时），求解子博弈精炼纳什均衡时所利用的后向归纳法（Backward Induction）不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）的要求。我们以两个参与人（A、B）的博弈情况为例，不仅要求参与人A、B是理性的，而且要求A知道B是理性的，B也知道A是理性的；A知道B知道A是理性的，B知道A知道B是理性的；A知道B 知道A知道B是理性的……，显然这个比理性概念要求更强的序贯理性假定与现实相差太远。
（2）经典博弈理论在处理不完全信息问题时有两种方法，1、假定各参与人知道“真实模型”的结构，但模型中的各参数是不可观察的，这种方法来源于萨维奇(Savage 1954)的思想，即参与人知道世界的各种状态，但不知道哪一种状态将会出现；2、假定各参与人知道各种可能状态客观的概率分布，给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，即海萨尼(Harsanyi 1967)在博弈论中处理不完全信息的方法。这两种处理方法有三大缺陷：其一、必须假定参与人知道世界的各种可能状态；其二、必须假定参与人知道在随机抽取状态上的客观概率分布；其三、必须假定参与人具有很强的计算、推理能力，且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。很显然，这三个假定与现实是不相符的。
（3）经典博弈理论作为预测工具的理论基础是纳什均衡及其精炼。这一理论不但要求各参与人完全理性，而且还要求参与人的预期满足一致性原则。所谓一致性原则，就是要求每个参与人正确地知道其他参与人将会如何选择。然而，这些知识从何而来呢？经典博弈理论对此有过许多研究并形成了几种共同的观点，如博弈前的交流（Preplay communication）、自我实现的预期（Self-fulfilling Prophecies）、聚点（Focal Points）等。博弈前交流的基本思想是假定参与人在博弈进行前讨论如何行为。如果能够达成协议，则该协议必定是一个纳什均衡，否则一定有参与人会违背协议；如果博弈存在多个不可比较的帕累托效率均衡时，那么博弈前的交流本身是一个讨价还价博弈，博弈最终达到并稳定于哪一个均衡是很难确定的（Aumann,1990对此进行过详细的论述）。自我实现预期的基本思想是，如果一个预测参与人行为的理论被博弈中各参与人知道，那么它就一定能够预测到纳什均衡（Myerson,1991对此有过详细的讨论）。前面这两种观点并不能说明参与人的知识从何而来，因而缺乏说服力。聚点是由 Schelling（1960）提出的，他认为：如果存在一个显式博弈规则 ⑤（Obvious way to Play），那么每个参与人知道其他参与人将作出何种选择，但这种所谓显式博弈规则又意味着什么呢？这又是一个难以回答的问题。
在现实中人并不是完全理性的。大量的心理学实验和经济学实验研究（特别是近年来实验经济学的迅速发展）表明，人类在作出经济决策时总是存在着系统的推理误差，而这些误差产生的原因大多来自于如信息成本、思考成本、激动和经验等因素的影响。心理学研究表明：人类认知能力有着心理的临界极限，认知作为一种资源是稀缺的，使用它必须支付一定的成本，然而人们在决策时很少把这种成本考虑进去。Herbert Simon(1990a, 1990b)认为，人类的推理能力是一种相对稀缺的资源，推理过程中要消耗大量的能量，这就隐含着思考活动也需要花费一定成本。大量对消费者行为分析的实验也表明，人们在进行消费选择时并不总是能够获得最大效用。例如，消费者在购买大型电器时，他们考虑得更多的是价格因素，而不会在价格与耗电量之间进行权衡 ⑥。现实中由于信息并不能免费获取，人们进行思考、推理等活动所需的成本也必须加以考虑，因而作出一个准确即符合理性预期的决策，所需的成本在多数情况下会超过决策的实际价值。现实中人并不是也不可能严格按照利润或效用最大化的要求作出决策。他们通过了解博弈的历史（即学习）及模仿其他参与人的行为而进行决策。Peyton Young( 1998)认为，现实中利润或者效用最大化只是影响决策的一个因素，决策时还必须考虑其他许多因素，其中一个特别重要的因素便是决策者所处的环境（如决策的历史背景、决策所处社会环境等）。
二、进化博弈理论的基本内容
进化博弈理论以达尔文的生物进化论和拉马克的遗传基因理论为基本思想。在生物进化过程中，只有在竞争中能够获得较高支付（繁殖成活率）的种群才能生存下来，获得较低支付的种群在竞争中会淘汰，即优胜劣汰。从对生物界中动植物进化的分析知道，动植物的行为可以说是不经过思考的，甚至一些有意识或无意识的行为选择最多也只是出于本能的直觉，根本无法与人类的理性相比，但是它们的行为最终却是趋于纳什均衡水平，也就是说，它们的行为是可以用纳什均衡概念来解释。生物进化遵循优胜劣汰的原则，在这种原则下它们的行为趋于纳什均衡，这就为进化论与博弈论相结合用于解释人的群体行为提供了一种可能。利用进化博弈理论研究参与人群体行为时，只要求参与人知道什么是成功行为，什么是不成功行为⑦ ，而不必知道成功与不成功行为的原因，从而最大限度地降低了对理性的要求，能够更接近于现实。
典型的进化博弈理论模型包括参与人群体集合，各群体个体之间进行重复、匿名⑧ 博弈。我们可以根据个体在博弈中属于不同角色（如参与人的行为空间）来划分群体。按博弈中群体数的不同，可以将博弈分为单群体(Monomorphic Population)博弈⑨ 与多群体(Polymorphic Populations)博弈。单群体博弈是指博弈在同一群体个体之间进行。在博弈的任何时刻选择不同策略的个体对应于一个群体分布，该分布又可理解为群体在该时刻所处的状态，它一般可用n-1维向量表示（n表示行为空间中纯策略的个数）。在具体博弈中每个个体都好像面对一个选择混合策略的对手，其实质是个体与群体状态之间的博弈，因而博弈的支付矩阵是对称的，所以它也被称为对称博弈。多群体博弈是指不同群体个体之间的博弈。在博弈的任何时刻选择不同策略的个体对应于一个群体分布，也就是该时刻群体所处的状态。多群体博弈的状态空间一般比较复杂，用(R(k1*k2*k3...*km))空间中的点来表示某时刻系统所处的状态（k1，k2,…,km分别表示不同群体中纯策略的个数），多群体博弈的支付矩阵是非对称的，所以它也被称为非对称博弈。
进化博弈理论的关键假定是，参与人并不是完全理性的而是幼稚的（Naive），即参与人不相信他们现在的行为会影响对手未来的选择，也不理会对手是否与他们进行同样的行为调整。各群体个体之间进行重复博弈，在博弈的任何时点，选择不同策略的个体在群体中都有一个概率分布与之对应，严格地说这个概率分布是一个经验分布。由于我们考察的是无限群体⑩ ，所以可以把这个经验分布近似看作一个概率分布。在进化博弈理论中，我们也用这个概率分布表示群体所处的状态，这种状态随着时间的演化而不断变化的。如果参与人知道这种状态且能够采取最大化行为，那么他就会选择一个最大化自己期望支付的最优反应策略；如果他不知道这个群体所处的状态，那么他就必须根据自己所掌握的信息对群体的状态进行推断。参与人所能利用的信息只能来自博弈的历史，因为这种历史传达着对手将会如何作出选择的有关信息，同时通过对历史的观察使参与人知道哪些策略是成功的、哪些策略是不成功的，参与人可以此作为决策的依据。由于进化压力及参与人对成功行为的模仿，本期中更成功的行为下期将会被更多的个体所采用。
进化博弈理论的基本均衡概念是进化稳定策略，该概念是由 Maynard Smith and Price(1973)、Maynard Smith(1974)在解释生态现象时提出的。其直观思想是，如果一个群体的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体更高的期望支付，随着时间的演化突变者群体最终会从原群体中消失，原群体所选择的策略就是进化稳定策略。就分析生态现象而言，由于我们把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失，如果用于分析人类群体行为，那么进化结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。进化稳定策略是从分析生态现象中得来的，我们知道在对生态现象进行分析时，常常把某个生态环境中所有种群看作为一个大群体，种群之间进行的是对称博弈，所以Maynard Smith 等提出的进化稳定策略概念一般适用于单群体情形。另外，进化稳定策略是一个静态概念，但它却能描述系统的局部动态性质 ⑾。
进化博弈理论用系统论观点来看待群体行为的调整过程，主要研究群体行为演化系统的变化。如何描述动态系统的状态变化是进化博弈理论的关键。对此，博弈论理论家们从不同的方面对演化系统的过程进行了描述：如Jonker and Tayler（1978）提出的模仿者动态（Replicator-Dynamics）模型、 Börgers and Sarin（1995）提出的刺激-反应动态（Stimulus-Response Dynamics）模型、Swinkels （1993）提出的近视调整动态(Myopic ?CAdjustment Dynamics)模型等等。根据动态系统达到均衡的过程是受到确定性因素影响还是受到随机性因素影响，可以把系统分为确定性动态系统（Deterministic Dynamics）和随机性动态系统 (Stochastic Dynamics)。确定性动态系统是指受到确定性因素影响，或者受到可以忽略的随机因素影响且按照一种确定的方式进行行为调整的系统，如Taylor and Jonker (1978)提出的模仿者动态所描述的系统。随机性动态是指把系统向均衡演化过程中受到不可忽略的随机冲击影响考虑进去的系统。随机动态系统一般利用维纳过程（Weiner Process）来描述系统所受随机因素的影响，并且把它直接加在确定性模仿者动态上（如Dean Foster and Peyton Young，1990）。与确定性动态相比，随机性动态系统能够更真实地反映系统的行为演化，但由于需要用到较高深的数学知识，因而比确定性动态系统的描述更复杂。
三、经典博弈理论与进化博弈理论的异同
理性假定不同
经典博弈理论从完全理性假定出发，把经济中参与人之间的行为关系看作一种原子式的互动或者机械式的反应。该理论认为，在任何情况下，参与人都能对环境的变化作出最优反应，然而在多数情况下这个强理性假定是难以满足的，因为它不仅要求参与人知道世界各种可能状态，而且要求参与人知道各种状态出现的客观概率及不同状态对自己支付的意义。进化博弈理论从有限理性出发，认为经济中参与人只能知道世界状态很少的一部分而不可能知道世界的所有状态，参与人也不完全知道各种状态出现的客观概率及不同状态对自己支付的意义。在多数情况下参与人并不能对环境的变化作出最优反应，其决策是基于某种常规（Routines）而非理性的计算结果，这种常规一般来自于博弈历史，因为博弈历史已经包含了对手如何行动的相关信息，同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。
研究对象、研究方法不同
经典博弈理论以参与者个人为研究对象，它虽然认为个人之间的行为是相互影响的，但却在假定其他参与人行为选择一定（从纳什均衡的定义可以看出）的情况下来考察个人最优化行为。即使在非对称信息动态博弈中，经典博弈理论也假定每个参与人都能从对手的选择中正确地推断出博弈的支付结构，进而预测到均衡结果，所以不需要考察系统达到均衡的动态过程，因而该理论主要利用比较静态法来研究均衡之间的关系。进化博弈理论则以参与人群体为研究对象，假定各群体个体之间的行为相互影响，且不同群体的个体之间进行重复、匿名博弈。个体在给定信息下并不一定选择最优化行为，而是通过学习、模仿、试验等活动来选择合意（Aspiration Levels）（并非最优）的决策，其均衡结果依赖于博弈历史及博弈所处的社会环境等，即达到均衡的过程影响均衡的结果。进化博弈理论主要利用动态方法研究系统达到均衡的调整过程，这种方法可以把从个体行为到集体行为的形成机制、组织和制度等因素都纳入到模型中，因此能够更真实地反应经济主体行为的多样性和复杂性。
动态概念不同
经典博弈理论虽然也研究动态，但与进化博弈理论所研究的动态有完全不同的含义。经典博弈理论的动态博弈假定各参与人都有特定的对手，以参与人行动的时间顺序及信息的传递为依据。在动态博弈中，后行动者通过观察先行动者的选择而作出最优反应决策，先行动者也会预期到自己的行动会传递与自己支付相关的信息，因而先行动者在给定预期（后行动者的行动反应）下选择自己的最优策略，显然这种动态博弈并不涉及到达到均衡的调整过程也不涉及外在因素对均衡的影响。进化博弈理论认为参与人并没有特定的博弈对手，并不需要考虑谁是先行动者，谁是后行动者，也不需要考虑信息的传递过程，它所强调的动态是相对于群体行为达到均衡的调整过程而言的。该理论从系统论出发，把群体行为的调整过程看作为一个动态系统，认为动态系统的均衡是达到均衡过程的函数，因而可以把影响均衡的各种因素都纳入到进化博弈理论模型中去。
均衡概念不同
经典博弈理论作为预测工具的基本概念是纳什均衡（Nash Equilibrium）及其精炼，纳什均衡（Nash 1950）是假定其他参与人的策略选择不变的情况下，每个人都选择使自己达到最大期望收益的策略，也就是说在均衡时，任何参与人单独偏离均衡策略都不会变得比不偏离好，用数学语言来说纳什均衡点是一个不动点（Fixed Point）。显然，纳什均衡是一个静态概念且不能描述系统的动态性质。进化博弈理论作为预测工具的基本概念是进化稳定策略 (Evolutionarily Stable Strategy)，进化稳定策略是指群体达到一种能够消除任何小突变群体的一种状态时群体所选择的策略，这个概念与动态系统的吸引子及渐近稳定性有相似的性质。进化稳定策略虽然是一个静态概念，但确能描述系统的局部动态性质，因而应用它能够更准确地预测参与人的行为。
达到均衡的过程不同
经典博弈理论从理性人假定出发，认为参与人能够对信息的任何变化作出迅速的最优反应，因而经济系统常常处于均衡状态，从非均衡到均衡是不需要时间的，当外界条件发生变化时，系统会迅速从一个均衡走向另一个均衡。这种思想来源于经典物理学，它把时间看成是一个可逆的过程 ⑿，单独分析各变量之间的关系，因而经典博弈理论主要采用比较静态法来解释现实现象。进化博弈理论从有限理性出发，强调经济变迁的动态过程，认为经济系统中参与人对信息变化并不都能作出迅速最优化反应，系统达到均衡是需要时间的，均衡是暂时的甚至是不可能的，非均衡才是常态和现实。系统的均衡点可能有多重，究竟达到哪一个均衡依赖于进化的初始条件及进化路径。进化博弈理论以一种动态的观点来研究经济中参与人群体的经济行为，它不仅考虑到行为主体客观经济行为，而且还涉及到包括价值观在内的主观因素，这种主客观相互作用的进化过程与现代哲学的认识论观点也是相符合的。
精炼均衡的方法不同
当博弈存在多个纳什均衡时，经典博弈理论主要利用后向归纳法（Backward Induction）来去掉博弈中不可置信的威胁而达到对纳什均衡的精炼，这种方法的前提条件是参与人的行为要满足一个更强的理性假定――序贯理性（Sequential Rationality）。进化博弈理论的精炼思想来源于前向归纳法（Forward Induction），该方法假定博弈历史包含了参与人未来选择的信息，该理论选择均衡的另一个标准是随机稳定性（Stochastic Stability），这是前后向归纳法所无法达到的。
结束语
进化博弈理论为我们提供了研究有限理性参与人群体行为的新思路，尤其是其基本概念ESS为我们预测参与人群体的行为提供了一个理论依据。国外已经有许多生态学家、社会学家及经济学家正在研究并拓展进化博弈理论的基本概念及其应用，而在我国对该理论的研究几乎还没有开始，希望本文能够起到抛砖引玉的作用，引起我国更多学者的关注，并用该理论来研究如经济体制改革、社会制度变迁及行业组织分析等经济行活中有待迫切解决的现实问题。相对于经典博弈理论，进化博弈理论应用于研究群体的经济行为，还只是处于初创时期 ⒀，其大部分结论还有待于接受实践的检验，其理论形式也还相当粗糙，没有形成一个统一的理论体系，但其发展却是相当迅速的，有许多博弈论理论家正在致力于拓广进化博弈理论的基本框架。从进化博弈理论的发展趋势及其广泛的应用来看，我们有理由相信总有一天它会成为主流经济学的一个重要组成部分。
注释：
①为了区别进化博弈理论，本文把源于冯诺依曼、摩根斯滕经纳什发展而成的博弈理论称为经典博弈理论。
②本文在写作过程中始终得到了恩师王则柯教授的悉心指导，在此谨向他表示感谢。文中如有不当之处概由作者负责。
③本文把源于Von Neumann and Morgensterm 经Nash发展而形成的博弈论称之为经典博弈理论
④给定各参与认为其他参与人的策略选择不变的情况下，任何参与人都没有转换策略的激励，因为均衡时任何参与人单独改变策略都不会变得比原来更好，更何况在多数情况下还必须考虑转换成本。
⑤这种方式可能来自于博弈本身的结构或者来自于博弈所处的环境（历史背景、文化习惯、公平、效率等）。
⑥经济学家把这种行为之为近视行为（myopic behavior）。
⑦一个行为的成功与否是通过参与人对博弈历史的观察得来的，成功行为常常通过教育的形式而传授下去。
⑧Hines(1980)首次考察了参与人进行重复非匿名博弈，非匿名即假定支付不仅依赖于不同策略在群体中的分布，而且依赖于选择不同策略的参与人，不同的参与人选择同一个策略进行同一个博弈也可能得到不同的支付。这与匿名博弈有着显著的区别。
⑨单群体博弈是指群体中个体无角色区分的博弈，有时也称为对称博弈。在进化博弈理论中，不同角色一般按个体所能够选择的纯策略集合是否相同来区分的，因此单群体博弈中所有的个体都有相同的行为空间。
⑩进化博弈理论一般假定参与人群体中个体数目无限，但也有经济学家研究了有限数目个体的博弈，如Schaffer, M. E., (1988)。
⑾ 可参阅本文第二部分进化稳定策略的定义
⑿所谓时间是可逆的是指当其他条件相同时，在不同时间会得到相同的结果
⒀一般认为进化博弈理论用于经济领域分析人的经济行为始于1973由Maynad Smith提出进化稳定策略这个基本概念以后
参考文献
王则柯, 何洁（1999）：《信息经济学浅说》，中国经济出版社。
王则柯（1999）：《博弈论评话》，中国经济出版社。
张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。
张良桥（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。
张维迎（1996）：《博弈论与信息经济学》，上海三联出版社。
- 复【文摘】理性与有限理性:论经典博弈理论与进化博弈理论之关系
  家园 给大家提供一个国内经济论文网站
  经济学家
  http://jjxj.com.cn/
  snowbean所转本文地址
  http://jjxj.com.cn/news_detail.jsp?keyno=1080

分页树展主题 · 全看

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明