• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 初中学习 > 正文

    【马丁.舒比克的博弈论思想】博弈论教程 罗云峰 pdf

    时间:2020-03-26 07:24:10 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘 要:博弈论的发展拓宽了经济学的研究领域,增加了经济学的研究方法。就目前人们对博弈论的应用而言,非合作博弈的研究仍占据主导地位,而在生活细节中,无不体现合作的状态,合作即是主流。马丁・舒比克正是研究合作博弈的专家,他用全新的合作视角展现出不一样的博弈论思想,他的市场博弈模型诠释了合作博弈的基本内涵,他将合作博弈模型应用于政治经济社会领域,拓展了合作博弈模型的应用空间。
      关键词:马丁・舒比克;合作博弈论;政治经济;社会结构
      
      Martin Shubik’s Thought of Game Theory
      GAO Xuan
      (Henan Academy of Social Sciences, Zhengzhou, Henan 450002, China)
      Abstract:The development of game theory widens the sphere of economic research and enriches economic methodology. As far as its present application is concerned, research in non�cooperative games still plays a leading role. Real life, however, in variably reflects cooperation: cooperation is the mainstream. Martin Shubik, an expert in cooperative games, presents a different game theory from a whole new cooperative perspective. He illustrates the basic meaning of cooperative games in his market game model and applies it in political, economic and social fields, enriching its sphere of application.
      Key words:Martin Shubik; cooperative game theory; political economy; social structure
      
      合作是经济研究中的一个重要主题,各方通过合作,可以发挥各自的优势和所长,共同创造最优的结果。如各方皆不合作的情况下,各方的整体利益,往往远离帕累托最优,甚至达到两败俱伤、皆不讨好的局面。动态博弈中各方的利益既是相互依存的,更多时候又是唇齿相依的。但是,由于参与博弈的各方利益间也存在冲突,搭便车的问题可能导致合作受到破坏,因此在动态环境下,合作将变得尤其困难。然而,现实的环境充满了动态合作情况,世界贸易谈判、境内境外投资、跨国污染控制、地方合作等等都是这样的例子。这些博弈不仅仅是合作的问题,更涉及了整个人类社会的发展繁荣和稳定。对此,研究舒比克的博弈思想,或许能给予我们一些启发和借鉴。
       一、舒比克的博弈思想
       耶鲁大学教授马丁・舒比克是现代博弈论的创始人之一,也是将博弈论应用于经济问题的先驱者。其博弈论思想为我们经济研究拓展了新的视野。
       (一)从非合作博弈到合作博弈
       在非合作博弈中,参与者只根据他们的“可察觉的自我利益”(perceived self-interest)来决策,因为前提假定了他们不表达自己的意图。在一个非合作博弈中,参与者之间的协议、威胁、许诺之类,是无法实施的,即便参与者在博弈中可以相互沟通。除了那些博弈规则确实允许的协议外,参与者无法达成有约束力的协议(binging agreement)。这样,在非合作博弈中,与具体情形有关的方方面面都必须明白无误地模型化在博弈规则中。然而,应该强调指出的是,非合作的参与者虽然仅仅由各自的私利所驱使,但在一些情况下,他们却表现出合作的行为。事实上,非合作博弈理论的一个显著结论就是:在这种体制下,内生的合作是可能达到的。
       相比之下,合作博弈假定参与者之间的协议是有完全约束能力的并且是能够实施的,即合作是外生的。合作博弈理论研究的可以是就怎样进行一场博弈达成有约束力协议的参与者之间无冲突的串谋。不过,在某种程度上,合作博弈可以被看成非合作博弈的一种特例,意即串谋和约束过程可以从外部植入博弈规则(或结构)当中的情况。[1]
       在非合作博弈中,强调的重点主要是个体行为:每个理性的参与者会做出什么样的决策,理性的参与者实际会怎样选择行动,博弈最可能出现的结果是什么等等。但在合作博弈中,摆在我们面前的是不同的问题。这时,强调的重点在于参谋者集体或参与者联盟(甚至包括所有参与者的大联盟),如他们会形成怎样的联盟,他们之间如何瓜分合作的收益等。如果合作确实带来收益,但这些收益不足以使所有的参与者接受最终的结果,那么就应假设存在一些使协议实施的外在“机制”。为了证明博弈的某一具体的结果是正当的,必须在关于理性的观点中加入一些关于公平的观点,因为这种机制产生的结果仅当使所有者都感到公平时才不会让任何一位有关的参与者感到不高兴。[2]
       舒比克认为人们对合作博弈论在行为科学中的应用价值通常有着严重的低估,但是对非合作博弈论的功效却有着过度的夸大。他认为合作博弈论的影响主要有两个方面。第一,在加强度量和偏好比较、单边支付存在或缺失的情况下,合作博弈论提供了一个高层次的吸引,这种吸引使我们能够重建和分析公理系统。这些公理是被设计用来检验微妙的概念,如权威、公平、公正、权力下放以及效率。第二,在规范分析可以解释的情况下,存在着大量的可以直接应用的问题。[2]
       在舒比克看来,非合作博弈均衡解对于巨大的市场而言是适用的,但是对于研究只有少数几个经济主体人的问题时就有着很大的局限性,而合作博弈均衡解恰恰能弥补这一缺陷。
       (二)舒比克的市场博弈模型
       舒比克合作博弈理论中,以他的市场博弈模型最为典型。限于篇幅,这里只作简略概述。
       “市场博弈(market games)”产生于交换经济,在这个交换经济中,交易者具有连续的、凹的货币效用函数。[3] 有n个参与人的市场博弈在所有存在附加支付的n人博弈空间中形成一个闭凸锥。每个市场不但存在核,而且是完全平衡的。我们要证明市场博弈等价于所有子博弈都存在核的“完全平衡博弈”。这两类博弈一致性的建立需要从一个市场中产生一个博弈,从一个博弈中构造出一个市场。也就是说对于任何存在核的博弈,我们都可以找到一个市场来复制该博弈解的行为。
       在市场博弈模型中,我们假定的市场形式是“直接市场”(direct market),即在这个市场中交易的商品实际上就是交易者本身,而且是无限可分的,交易者具有一样的效用函数而且是一阶齐次的。从一个博弈构造出它的直接市场,效用函数建立在“可分的参与人”(fractional player)对各个联盟活动的最优分配上。博弈的壳是该博弈直接市场对应的市场博弈。博弈的壳对每一个联盟来说至少和原博弈一样有利可图。每一个完全平衡博弈就是它本身的壳,因此市场博弈也就是它本身的壳。这就说明了市场博弈和完全能平衡博弈是等价的,也就是说一个博弈是市场博弈当且仅当该博弈是完全平衡时成立。
       舒比克通过市场博弈模型的构建,认识到市场博弈模型的核心――市场博弈和完全能平衡博弈是等价的,从而得出隐藏在模型后的一些重要的结论:
       1.如果博弈(N;υ)存在核,那么由直接市场生成的新博弈的映射与该博弈的映射相同,反之亦成立;
       2.一个完全平衡博弈和它的壳是等价的;
       3.一个博弈是市场博弈并且仅当该博弈是完全平衡时成立;
       4.每一个市场都在博弈理论上等价于一个直接市场;
       5.每一个平衡博弈和它的壳都是支配等价的;
       6.如果(N;υ)是一个平衡博弈,那么就存在一个市场,该市场与博弈(N;υ)有完全一样的解。
       二、舒比克博弈思想的应用
       舒比克的研究领域十分广泛,其研究角度都是从博弈论出发的,涉及了国防、运筹学、寡头理论、投票、拍卖、联合成本的分配等方面。他还进行了实验博弈论、运筹博弈论以及博弈模拟实验的研究,其中很多内容对于目前以及将来博弈论的研究发展都有很好的指导意义。这里主要阐述舒比克在政治、经济、社会领域的博弈论应用。
       舒比克通过同时考虑最优选择和进化行为(evolutionary behavior)的方法来对社会政治经济模型进行描述和扩展。[4] 绝大多数的经济理论是在给定的博弈规则下强调最优选择,但是在一个复杂的进化的社会中,对一类个体给定的假设条件和规定对另外一类个体可能是变量。在短期经济理论中或多或少地强调理性人是在一个限制的条件下追求定义好的目标,但是社会学家、心理学家和精神学家都把人们看成一个习惯的产物,有着内心的矛盾、有限的视角并且缺少明晰的目标。先前的数学方法和工具既提供了精确的分析但又将我们的注意力束缚在严格限制和简单环境中定义好的问题上。
       (一)模型介绍
       舒比克希望通过有限理性的博弈理论的方法为政治经济和政府机构行为模型的重建和分析提供基础,这种方法为经济、政治和社会模型提供了桥梁,但是保留了原来分析工具的大体框架。这里所介绍的模型融合了经济、政治结果和政府因素,主要以美国政治结构为基础,但是它可以看作一系列此类模型的代表。社会人、政治人、经济人三个角色融合的关键是理解关于行动的有限理性、有限视角、有限能力,需要差异函数、学习和对目标的敏感度。
       经济理论中的各种角色,例如消费者、生产者、政府本身并无本质差异,都是单个的理性参与者,性质上是相同的,但政治和社会理论中的一些角色在目的和认知上有很大差别并相互影响。不考虑精英、专业人士、招募活动的动力在长期是如何形成的,我们只假设这些差异是给定的。以下的论述是在这些差异的基础上建立短期模型,理解政治、经济和官员力量之间相互作用如何对公共产品和服务的有效供给和需求产生影响。同时,如果能进一步扩展参与者的模型,将更有助于理解有限理性的实际意义。
       个体参与者包括公民、选举人、消费者、工人,积极的政党成员、政府职员和被选举者,商界精英、其他各界精英,政府机构的普通员工。机构参与者包括政党、政府和政府官员。
       效用函数在微观经济理论中描述的是具体数量的产品或服务,在经典的商品社会模型中一般假设有n个个体和m种商品,每一个体i最初占有的资源有w1I 、……公司之间互相买卖商品和服务,但政府提供的是大的政策。一般政府提供的政策包括15到30项内容。美国和其他一些国家的统计上关于这些政策基本是一样的,如国防、就业和工作环境、司法和安全、科技、国际关系、交通和通信、人口、文化、移民、农业 、医疗保健、资源、教育、工业制造、福利、环保、住房、金融、社会治安、税收。上面所列各项都需要统一的政策去执行,在传统的消费者选择理论的效用函数中没有直接引用这些。[4]
       每一项政策选择后,都有政策实施计划和成本预算。成本预算包括许多,比如警车、枪支、通信设备和其他警察执行公务活动所需要的物品。但物力投入不能描述产出的好坏和多少,政府和选民只提出或投票支持某一政策而不是具体的物品。公共物品大部分都体现为一揽子政策。有时,一个具体的东西,比如关于选民所在社区的一个医院,个体的选民就可投票是否支持政府发行债券去建立医院,但只能是某一个地方或城市的支出,而非是国家层面。
       产品和直接服务的价值以及社会和政治体系价值是由个人的偏好结构决定的。个人是被看作一系列合作型代理人的组合,每一个代理人都有着不同的决策,以及对共同知识有着不同的理解和行动。个体的结构可以被视为由代理人代表的单个理性参与者,这些参与者的代理人被要求在个体所面临的一系列决策的有限信息下行动(见下图)。可以这样理解:个体至少是在政治、经济和社会模式下行动。不同类型的个体有不同类型的偏好。
      (二)模型分析
       首先考虑经济决策的结构,将投资和创业与就业和个人理财分开是值得建议的。个人通常既不是企业家也不是投资者,他们的钱通常以储蓄的形式由金融机构进入投资环节。
       在社会中可以被看作企业家或者是投资者的个体通常对于他们的行为有明确清晰的子路径,而对其他许多个体而言,占据他们成人时光中很大一部分的一个最重要的考虑就是他们的工作问题,这包括对工作的长久性、熟练度、经验、流动性、升职前景、养老和失业的考虑。个体或者社会对这些考虑都是不同的,大多数的个体在处理他们的就业问题时至少会有一些习惯性的选择。
       个人的资金用于储蓄和消费。获取收入以后,个人所做的最多的经济选择是如何使用个人资金。尤其是对于消费,个人倾向有许多具体的和习惯性的路径选择。比如说购买打折商品、如何选购汽车、知道哪里有最好的商店、可以辨别不同质量的商品都是这些路径的表现形式。
       应该将职业政治家与普通选民、施压团体、游说团体区别看待。比如政治活动中有职业的政治家专门从事政治活动,把政治作为职业;而普通选民只有在选举的时候参与政治活动,不可能投入大量时间作出理性的政治方面的决定。
       这里,我们不去讨论个体道德和习惯的社会学,因为这个层面的活动受长期的因素影响。习俗的变化、机构的改革、规范的演变和社会结构变化所需的时间和几次选举的时间在长短上相差是很大的,不在一个数量级上。上图中,当个体作为一个社会人时,个体的活动直接指向了家庭以及和个体密切的当地组织、作为整体的社会。社会的价值观虽然并不成熟,在个体的头脑中并不明显,但却很重要。
       我们在此采用的方法与描述对普通商品的消费或者对于储蓄标准的效用函数结构基本一致。当选民选举时,某一个或两三个方面,如个人的财富、工作或者生意(这里的财富并不具体指个人的收入、也不管是那种形式的财富),都可以直接用来衡量经济状况。选民投票前,对政治或官僚权力等并不关心,他只关心那些政策计划,还有个人的财产或者工作、生意是否会受到影响。另外,选民还会考虑一个因素,就是政党是否执行选举前承诺的或提出的政策。
       政治舞台上经常会喊出一些口号,说一些虚的东西,往往没有具体的内容,更没有成本收益分析,成本就没有约束。当面对两三个政策时,选民会对这些政策进行比较,但面对很多的政策时就不会去比较了。选民,甚至大多数政治家最多会考虑5到10个不同的政策,这些政策往往都是以前提出的或实施的,或者作为某些政策的替代政策。
       有些政策,例如司法、平等、外交等方面的政策效果评价更难一些。帕累托最优曲线也不能适用于选民的投票和拉票。一般来说,大多数个体可以辨别哪些职能部门对于他们来说是最有吸引力的。进一步来说,他们的这种判断会受到哲学家、新闻评论人、诗人和政治家正面或是负面的影响。比如有些人的判断受物质的影响,有些人可能受到苏格拉底和亚当・斯密的影响。
       舒比克不是在一个真空中讨论帕累托最优,他的考虑是基于过程模型的。这些考虑必须包含是谁选择了政策和这些职能,在他们有发言权的情况下,个体是怎样对这些政策职能进行投票的。
       社会学家、政治学家和道德家有任务细化职能产生的机制、主导的选择、选择的特性和选择的规则,而这些如果是经济学家做,他们可以通过很多途径轻易完成。比如,可以假设所有的职能都是通过财富的形式体现,所有的个体对于财富的偏好可以用一个连续的效用函数来表示,而他们的选择机制是效用最大化。
       在控制复杂过程的知识和能力之间存在一个基本权衡。对细节理解越多,数据就越好,控制主体也就更可能根据环境细节来调整自己的行动。舒比克认为:策略规模可能比知识更重要。一个规模很小的主体可能有极强的洞见,但是影响力却是微乎其微的。而当主体的规模相当大时则可能正好相反。政府通常是规模很大的主体,另外,它还是一个垄断者。在一个民主社会中,可能存在不同政党竞争政府的控制权,但是在同一个民族国家中却没有相互竞争的政府。
       政府不是自然人,但它是由很多自然人创造出来的。为了分析的方便,在研究许多有关价格、市场和技术效率的基本经济学问题时,微观经济学家可以忽略政府或将其抽象为更为高度简化的常量,但是,这种便利性在宏观中无法实现。政策和政府体系的经济方面必须是可行的宏观经济理论的基本组成部分。宏观经济理论不仅是过程导向的,而且必须与特定背景相联系,而政府、官僚体系和社会就是其背景。
       三、舒比克博弈思想的评价
       在以上的部分我们阐述了舒比克经济理论的大致内容,对于他思想的全面阐述不是一篇论文能够完成的,这里只能作为未来进一步研究的铺垫。随着深入研究舒比克的思想,越来越发现他的理论是如此有吸引力,可以打开我们研究问题、考虑问题的另一个视野,也对现实经济具有很大的指导意义。
       (一)对主流经济学的补充
       舒比克一直强调将一般均衡理论改进为对经济过程的机制和载体模型化,而不特别描述人的经济行为或动机。一般均衡理论和大部分微观经济理论都建立在最大化效用或利润的个体或厂商的假想个体之上,优美的逻辑结构也建立在这些行为假定上。与此相对,许多宏观经济理论是对这些行为假定的修补,它们被设计用来对当前危机或政策提供可行与可操作的洞见。[5]
       (二)对当前以及未来经济学发展的看法
       一般均衡理论曾经对经济学研究的发展产生了巨大的推动作用,是现实经济生活非常好的抽象。但舒比克认为,未来经济学的发展会更注重动态经济学的研究,这就需要建立经济分析的过程模型。任何一个过程模型都需要对限制过程性质的种种规则作出说明,因为这些规则明确了作为过程载体的基本经济制度。
       舒比克指出,仅仅对博弈进行抽象的描述,是远远不够的,我们必须同时明确个体是如何进行博弈的。正是从这个意义上,我们必须放弃在一般均衡中所使用的对经济人的简单抽象,取而代之为一个具有学习、推断以及预测能力的决策者的模型。经验和专业技能在经济学分析中扮演着非常关键的角色。我们可以把决策者看作一台高度灵活的机器,他在进行职业选择的时候,会建立一个专门化的信息库和日常事务集合。在模型中加入学习、推断以及专业技能等因素的分析,并非只是对理论进行微不足道的修正,恰恰相反,这些因素在动态分析中占据着概念中心的地位。从表面上看,经济系统似乎包含了经济个体的局部最优化,但从长期来看,个体独立进行的这些缺乏洞察力的最优化尝试,最终将归并为一个整体,并反馈给系统,从而改变被经济个体看作参数的长期变量的值。
       舒比克认为,经济科学在某些方面的未来发展可能会出现四种研究方法的结合,分别是:1.运用一些经济学理论去获取与某一系统相关的分析或计算结果,2.设计一个博弈去检验这些结果,3.或者设计一个持续的动态观察方法去检验这些结果,4.设计一个具有学习方案或者推理系统或者虚拟参与人的模拟实验,与实际的行为进行比较。同时,在未来将会产生一系列实务性很强的特殊模型,这些模型都包含制度分析以及数据库两部分基本内容。[6]
       随着计算机的飞速发展,使原来许多不可能进行的博弈实验成为可能,但是舒比克觉得遗憾的是,当前的社会科学,尤其是经济学的研究,却没有建立大型的博弈实验室,也没有考虑利用一些在线的网络设备或是软件,收集各种博弈实验的瞬时数据,例如对拉斯维加斯的赌注投注额、实际拍卖投标额、购买彩票以及其他有风险的行为的及时数据进行追踪处理,并建立起博弈实验的数据。
       (三)“白鲸猎人”式的研究风格[7]
       白鲸是一种超然的、人类难以征服的图腾式的象征,它也象征着对理性的追求。白鲸猎人的一个重要特征是胃口特别大,极富有追求精神,他们研究的题目都是富有挑战性的,都有一种永不言败的精神,誓以捕到白鲸为目标。他们从不轻言放弃,即使一辈子捕不到白鲸他们也会继续下去。舒比克以狂热的“白鲸猎人”来形容自己的研究风格,在他看来,成为成功的白鲸猎人的一个必要条件,是具有执著的精神。在现实生活中我们也会发现,执着最终会成为一种生活方式。执着来源于“有所求”,也就是让你对某事物的渴求变为一种燃烧的欲望。正如舒比克读到博弈论书籍时便下定决心打算为之奋斗终生一样,当你开始爱上一种念头,身体的各个部分便会像吸铁石一样被吸附着,执著就成为了实质意义上的主动。
       今年已经83岁的舒比克看起来依旧精干、活力充沛,不乏幽默和睿智。听到他谈论博弈论时语调的激昂,述说他的想法时的热情,令人深深感受到了这位学者内心的狂热和对未来的执著。舒比克至今为止发表了300多篇文章,出版了12本书籍,是一位非常多产的学者。舒比克取得的成就与他执著严谨的学术精神是分不开的。他不迷信权威,对许多钦佩的经济学家的观点产生了怀疑,然后经过论证得出自己的结论。
       舒比克是一位个性鲜明的经济学家。他兴趣广泛,在博弈论、货币金融制度理论和计量经济学方面都有着深入研究。在他的研究中不难发现,他的很多理论都是在与别人合作的基础上取得的,也正应了他研究的方向是合作博弈论。在现实中能很好合作的人,其理论往往也是严密有理的。最令人钦佩的是,舒比克总是在自己的研究领域中不断地追寻自己的梦想,是一个永远走在猎捕白鲸道路上的经济学家。
      
       参考文献:
       [1]克里斯汀・蒙特,丹尼尔・塞拉.博弈论与经济学[M].张琦,译.北京:经济管理出版社,2005.
       [2]Shubik, M. Game Theory, Complexity, and Simplicity[J].Cowles Foundation Paper, 1999: 967.
       [3]哈罗德・W・库恩.博弈论经典[M].韩松,等,译.北京:中国人民大学出版社,2002:319-341.
       [4]Shubik, M. he Game Within The Game. reprinted in F.X. Faufmann, G. Majone and V. Ostrom (eds.), Guidance, Control, and Evaluation in the Public Sector, Walterd, Gruyter,1986.
       [5]马丁・舒比克.货币和金融机构理论(第1卷)[M].王永钦,译.上海:上海人民出版社,2006:4.
       [6]马丁・舒比克.货币和金融机构理论(第2卷)[M].王永钦,译.上海:上海人民出版社,2006:97.
       [7]王则柯.经济学家的学问故事[M].北京:中信出版社,2003:209-239.
      责任编辑:叶晓军

    推荐访问:马丁 思想 博弈论 舒比克的博弈论思想 马丁怀特的现实主义思想

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章