博弈论历史大全精选
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。以下是学习啦小编为你整理的博弈论发展历史。欢迎欣赏阅读。
博弈论发展历程
博弈的原始思想萌芽于两千多年前,《孙子兵法》、《孙膑兵法》、《三十六计》、《六韬》等书中就有许多博弈案例,“田忌与齐王赛马”就是博弈实例之一。《摩诃婆罗多》、《梨俱吠陀》、《圣经》中记述了骰子游戏,我国在春秋战国时期就出现六博、围棋等博弈。
在西欧,德国哲学家和数学家莱布尼茨于1710年就预言了关于策略博弈理论出现的必要性和可能性。其后两年,詹姆斯·华尔德格拉特 (James Waldradre)首次提出了“极小极大”定理的概念。虽然对具有策略依存特点的决策问题的零星研究则可上溯到18世纪初甚至更早,但是,博弈论的真正发展与成熟还是在20世纪。
在20世纪20年代,法国数学家波莱尔 (Borel)最早用数学语言刻画了博弈问题,提出了“策略”和“混和策略”概念,用最佳策略和概念研究了下棋和其它许多具体的决策问题,并试图把它们作为应用数学的分支加以系统研究。冯·诺伊曼(Von Neumann)是博弈论(又称对策论)的创始人之一,1928年他发表“关于伙伴游戏理论”(Zur Theorie der Gesellschaftsspiele)提出两人零和博弈的极小极大定理。他首次证明了博弈论基本定理,即“每个矩阵博弈都能通过引进混合策略而被严格决定”,现代博弈论正式诞生。他讨论了合作对策问题,特别是三人零和博弈中有两方联合的情形,结果表明在附加条件下,N人博弈问题的解存在且唯一。
1944年冯·诺伊曼和摩根斯坦(Morgenstern)合作的《博弈论和经济行为》一书提出合作博弈的基本模型,标志着系统的博弈理论的初步形成。他们创立了博弈论研究的基本概念。到20世纪50年代,合作博弈发展到鼎盛时期,包括纳什(Nash)和夏普里(shapley)的“讨价还价模型”,吉尔斯(Gillies)和夏普里关于合作博弈中的“核”(Core)的概念以及其他一些人的贡献。
20世纪50年代合作博弈论达到顶峰,同时非合作博弈论也开始创立。纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章《N人博弈的均衡点》、《非合作博弈》,明确给出了“纳什均衡”的概念和均衡存在性定理,对合作博弈和非合作博弈进行了明确的划分。图克(Tucker)于1950年定义了“囚徒困境”(prisoners’dilemma),他们两人的著作基本上奠定了现代非合作博弈论的基石。
20世纪60~70年代是博弈论的发展时期。1965年,莱因哈德·泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析,提出了子博弈完美纳什均衡(subgame perfect Nash Equilibrium)概念;1967~1968年约翰·C·海萨尼(John C Harsanyi)把不完全信息引入博弈论研究,提出贝叶斯纳什均衡(Bayesian Nash Equilibrium)概念。1975年,莱因哈德·泽尔腾引入动态博弈 (dynamic game)和不完全信息博弈[,提出完美贝叶斯纳什均衡(Perfect Bayesian Nash Equilibrium)。
20世纪80年代以来,博弈论空前发展并逐渐成为主流经济学的一部分。1982年克瑞普斯(Kreps)[16]和威尔逊(Wilson)合作发表关于动态不完全信息博弈的研究成果。此外还有克瑞普斯(Kreps)、米尔格罗姆(Milgrom)、罗伯茨(Roberts)和威尔逊 (Wilson)在1982年发表的关于信誉问题的研究成果,被誉为“--模型”(即KMRW声誉模型)。
博弈论的形成是一个不断发展的过程,也是不断放松一系列严格假定的过程,尤其是严格的理性人假定,因为人类的目标不仅仅是经济利益最大化。基于实验经济学的行为博弈论在现实的框架中用更加人性化和社会化的方式分析参与人的行动。在投资博弈(investment games)中,博弈论认为由于参与人双方都是理性自利的,因此均衡解是双方的支付都为0,但行为博弈论在实验的基础上考虑了信任这一行为因素,而后得出参与人双方很可能合作而使双方的支付都增加;在可置信威胁议价博弈(ultimatum bargaining)中,博弈论认为对应者会接受出价者付出的任何金额,因为有总比没有好,但实验研究发现若远低于总收益的50%,对应者宁愿牺牲自己的利益拒绝对方的出价而使双方的支付都为0,行为博弈论提出这是因为参与人偏好公平,厌恶不公平的心理因素所造成的。在“大陆分水岭”博弈(“continental divide”coordination games )中,博弈论无法解释为什么实验中有的参与人选择高支付的均衡点,而有的参与人却选择低支付的均衡点,但行为博弈论却可以用文化、传统、幸运数字以及相互的沟通来解释这种异象。“选美比赛”竞猜博弈(“beauty contest”guessing games)的标准博弈解是0,但事实上一般人根本没有博弈论所要求的重复剔除劣战略的能力,因此行为博弈论提出有限重复推理和博弈认知不断深化。
进化博弈理论(Evolutionary Game Theory)来源于对生态现象的研究,从否定传统理论赖以成立的基础——理性人假定出发而建立起来新的分析框架。斯密斯(Smith)与普瑞斯(Price)提出演化博弈理论中的基本概念——演化稳定策略(Evolutionary Stable Strategy)。“演化稳定均衡”不是一个终极状态,只代表博弈过程中的某个阶段。演化关注的是博弈的过程,而不是博弈的结果,而演化的过程不能许诺一个完美的结局。进化博弈理论在处理有限理性参与人决策问题时,去掉参与人偏好、信念及理性假定等条件,假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。国外许多经济学者纷纷应用该理论来分析诸如社会制度形成、行业发展趋势、社会习俗演化等现象,获得极大的成功。
在《博弈学习理论》一书中,朱·弗登伯格(Drew Fudenberg)和戴维·莱文(David Levine)对均衡什么时候出现以及为什么均衡会出现提出另一种解释:均衡是并非完全理性的参与人随时间的推移寻求最优化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
总结博弈论的发展历史,可以发现对于理性人假定的不断放松以至于达到完全不需要理性的程度。同时,博弈论的发展过程也是它和各学科不断紧密结合的过程。
博弈论理论历史
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系[3]。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。
看了博弈论发展历史