注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

柳州文铮

CANTOR SET&ART

 
 
 

日志

 
 

博弈论Game theory股票数学模型对冲基金方法  

2012-10-31 10:50:19|  分类: 股票数学模型对冲 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |



约翰·冯·诺伊曼
博弈论是研究战略决策 。 更确切地讲,它是“智能理性的决策者之间的冲突与合作的数学模型的研究。“ [1]另一种一届的建议“[2]博弈论的纪律作为一个更具描述性的名称“ 互动决策理论 。主要用于经济学,政治学,心理学,以及逻辑和生物学。 的主题,首先解决的零和游戏 ,一个人的收益正好等于其他参与者(S)的净亏损。 然而,今天,博弈论适用于广泛的阶级关系,并已经发展成为一个涵盖性术语 ,包括人类和非人类一样,计算机科学的逻辑侧。 典型的用途包括一颗平常心,在众多游戏中,每个人都有发现和开发的一种战术,不能成功他的成绩越好,其他的方法。

现代博弈论的想法就存在的混合策略均衡的二人零和游戏,其证明由约翰·冯·诺伊曼开始。 冯·诺伊曼的证明原件Brouwer的连续映射的不动点定理紧凸集,成为一个标准的方法,博弈论与数理经济学。 他的论文其次是他1944年的著作游戏论与经济行为 ,与奥斯卡·摩根斯 ??坦 ,考虑合作博弈的几名球员。 这本书的第二版提供了一个不言自明的预期效用理论,数理统计学家和经济学家治疗不确定性下的决策。

这个理论在20世纪50年代,许多学者。 博弈论,后来明确地应用到生物学在20世纪70年代,虽然有类似的发展至少可以追溯到远在20世纪30年代。 博弈论的一个重要工具在许多领域得到了广泛的认可。 8个游戏理论家们获得了诺贝尔经济科学奖 , 约翰·梅纳德·史密斯颁发的克拉福德奖 ,他的博弈论中的应用生物学。

表示的游戏
另请参阅: 在博弈论中的游戏名单

博弈论研究的是本场比赛定义的数学对象。 一个游戏由玩家一组,一组的动作或策略,提供给那些球员,每个组合的策略和规范的支付。 大多数合作博弈的特征函数形式,而广泛的和正常的形式被用来定??义非合作游戏。


编辑 ]粗放型
主要文章: 粗放型的游戏


一个广泛的形式游戏

可用于广泛的形式,正式比赛用的时间顺序移动。 游戏玩法上的树木 (如图示的左侧)。 这里的每个顶点表示一个点(或节点)的播放器给出。 该播放器被指定由顶点列出由数量。 线的顶点代表该玩家可能采取的行动。 的支付被指定在树的底部。 可以被看作是一个多玩家的决策树的泛化的广泛的形式。 ( 弗登伯格和梯若尔1991年 ,第67页)

在游戏图的左侧,有两个玩家, 玩家1移动,并选择或者 F 或 U 玩家看到玩家1的举动,然后选择A或 R。 假设玩家1选择U和玩家2选择A,那么玩家1得到8 播放器2得到2。

广泛的形式也可以捕捉到不完全信息的同时,移动游戏和游戏。 来表示,无论是的虚线连接不同的顶点代表相同的信息集的一部分(即,球员们不知道他们在这点),或周围绘制一个封闭的线。 (请参见示例中的不完全信息“部分 。)


编辑 ]普通形式

玩家2 
选择左
玩家2 
选择右键
播放器1 
选择最多
4,3个 -1,-1
播放器1 
选择向下
0,0 3,4
正常的播放器,战略游戏的形式或支付矩阵

主要文章: 普通形式的游戏

正常(或战略形式)的游戏通常是由一个矩阵的球员 ??,策略和付费账(见的例子在右边)。 更一般地,它可以由任何函数表示相关联的每个玩家与每个可能的组合动作报偿。 在附图的示例中,有两个玩家,一个选择的行和其它选择的列。 每个玩家有两个策略,其中所指定的行的数目和列的数目。 在内部中所提供的支付。 第一个数字是行播放器(在我们的例子中玩家1)收到的回报,第二个是列播放器(播放器在我们的例子中)的回报。 假设玩家1播放和播放2次左 。 然后玩家1得到了回报为4,播放器2得到3。

当一个游戏在正常的形式,它被假定,每个玩家同时作用,或者至少,不知道的其他的动作。 如果玩家有一些有关其他球员的选择,游戏通常是在广泛的形式。

每一个广泛的形式的游戏具有等效的正常形式的游戏,但是转换到正常形式可能会导致一个指数爆破中的代表性的大小,使其计算不切实际。 ( 莱顿·布朗2008年及Shoham ,第35条)


编辑 ]特征函数形式
主要文章: 合作博弈

在游戏中,拥有可移动的实用单独的奖励不给,而是特征函数决定的每一个团结的回报。 我们的想法是在所有的统一,是“空的”,可以这么说,没有收到奖励。

这种形式的起源是向被发现在约翰·冯·诺伊曼和奥斯卡·摩根斯坦的书,在这种情况下时,他们猜到,当一个工会?出现,它的工作对的分数(N / C)好像两个人分别扮演一个正常游戏。 的C平衡的回报是一个基本的功能。 虽然有不同的例子,从正常游戏确定coalitional的金额,没有全部出现,它们的功能形式可以来自等。

形式上,一个特征函数被看作是:(N,v)的,其中N表示的组的人以及v:2 ^ N - > R是一个正常的实用程序。

这种特性功能扩展来描述游戏中有没有可移动的工具。


编辑 ]分区函数形式

联盟形成的特征函数形式可能忽略了外部性 。 在分区函数形式的收益不仅取决于其成员的联盟,同时也对其他球员分区( 萨尔·卢卡斯1963年 )。


编辑 ]和应用使用

博弈论作为应用数学的方法,被用来研究各种各样的人类和动物的行为。 它最初是在经济,收集了大量的经济行为,包括行为的企业,市场和消费者的了解。 博弈论在社会科学的使用已经扩大,并已被应用到政治,社会和心理行为,以及博弈论。

博弈论分析是在20世纪30年代,最初用于研究动物行为罗纳德·费舍尔 (尽管达尔文做了一些非正式的博弈论语句)。 这项工作早“博弈论”的名称,但它分享这一领域的许多重要功能。 后来被应用到经济学的发展生物学,主要是由约翰·梅纳德·史密斯在他的著 ??作演化与博弈论 。

除了 ??被用来描述,预测和解释行为,博弈论也被用来发展理论的道德或规范的行为,并规定这种行为。 [3]经济学和哲学 ,学者应用博弈论,以帮助良好或正确的行为的理解。博弈论这种类型的参数可以发现,早在柏拉图 。 [4]


编辑 ]描述和建模


三阶段之蜈蚣博弈

首先已知的用途是描述和模拟人类群体的行为方式。 有人[ 谁? ]学者认为,通过游戏寻找平衡点,他们可以预测实际的人类群体的行为时,面临的情况类似的游戏正在研究。 这种特殊的博弈论,根据最近的批评。 首先,它是批评,因为游戏理论家的假设经常被违反。 博弈论假设的球员 ??总是行动的方式,直接最大限度地发挥其胜( 经济人模型),但在实践中,人的行为往往偏离这种模式。 对这一现象的解释有很多非理性的 ,新车型的讨论 ,甚至是不同的动机(如, 利他主义 )。博弈论作出回应,他们的假设,在物理学中使用的比较。 因此,虽然他们的假设并不总是持有,他们可以把游戏理论作为一个科学合理的理想类似于物理学家使用的模型。 然而,在蜈蚣博弈 , 猜2/3的的平均游戏,和独裁者博弈 ,人们经常不玩的纳什均衡。 这些实验已经证明,个人不玩了均衡策略。 有一个正在进行的辩论,关于这些实验的重要性。 [5]

另外,一些[ 谁? ]作者声称,纳什均衡不提供人类人口的预测,而是提供了一个解释,为什么发挥纳什均衡的人口,保持该状态。 然而,问题的人口达到这些点仍然开放。

一些[ 谁? ]游戏理论家们把进化博弈理论,以解决这些问题。 这些模型假定没有理性或有限理性的一部分玩家。 尽管名字,演化博弈论也未必相信自然选择,在生物学意义。 进化博弈论包括生物和文化的演变和个人学习(例如, 虚拟游戏动态)模式。


编辑 ]规范或规范分析

合作 缺陷
合作 -1,-1 -10,0
缺陷 0,-10 -5,-5
囚徒困境

另一方面,一些[ 谁? ]博弈论学者认为人类的行为作为预测工具,但作为一个建议,人们应该如何表现。 由于纳什均衡的游戏构成了一个人的最好的回应与其他玩家的行动,发挥了战略,是一个纳什均衡的一部分似乎是恰当的。 但是,这博弈论也受到批评。 首先,在某些情况下,它是适当的,如果一个人指望他人发挥非平衡策略以及发挥非平衡策略。 举个例子,看你猜平均水平的2/3 。

第二, 囚徒困境提出了另一种潜在的反例。 在囚徒困境中,每个玩家追求他自己的利益,导致双方球员要差一些比他们不追求其自身利益。


编辑 ]经济和商业



本文不完整 , 请帮助改善的文章,或讨论问题的讨论页上 (2010年11月)。

博弈论是在数理经济学和商业竞争行为的相互作用 建模的主要方法。 [6]应用程序包括一个广泛的经济现象和做法,如拍卖 , 议价 , 兼并和收购的定价, [7] 公平分配 双头垄断 , 寡头垄断 , 社会网络的形成, 基于Agent的计算经济学 , [8] 一般均衡 , 机制设计 , [9] , 投票系统 , [10]和整个实验经济学等广泛的领域, [11] 行为经济学, [ 12] 信息经济学 , 产业组织 [13] , [14]政治经济学 。 [15] [16]

本研究通常集中在特定的组策略被称为游戏中的平衡点 。 这些“解决方案概念”通常是基于什么需要规范的合理性 。 在非合作博弈中,最有名的是纳什均衡 。 一组策略是一个纳什均衡,如果每个代表的其他策略的最优反应。 所以,如果在纳什均衡中,所有的球员 ??都打的策略,他们没有单方面偏离的动机,因为他们的策略是最好的,他们可以这样做,别人在做什么。 [17] [18]

回报的游戏,一般都是采取代表球员个人的效用 。 通常在建模情况下的支付的钱,这大概是对应于个体的效用。 然而,这种假设,可能会出错。

一个典型的博弈论在经济学上的纸张开始呈现出游戏,是一个抽象的一个特定的经济形势下。 选择一个或多个解决方案的概念,笔者演示设置在游戏的战略是适当类型的平衡点。当然,有人可能会想知道有什么用信息。 经济学家和商业教授提出了两种主要用途(如上所述): 描述和规定 。 [3]


编辑 ]政治学

博弈论政治学的应用主要集中在公平分配 , 政治经济学 , 公共选择 , 战争的谈判 , 积极的政治理论社会选择理论的重叠区域。 在这些领域中,研究人员已经开发出的球员往往是选民,州,特殊利益集团和政治家的博弈论模型。

对于早期博弈论应用于政治学的例子,请参阅安东尼·唐斯的工作。 民主的经济理论 (唐斯1957年 )在他的书,他的的霍特林公司选址模型适用于政治进程。 在Downsian模型,政治候选人承诺意识形态上的一维的政策空间。 丘陵的政治候选人首先演示如何将收敛到喜欢的意识形态,中间选民,如果选民充分了解,但随后认为,选民选择保持理性的无知,允许候选人分歧。

民主和平的一个博弈论的解释是在民主国家,公众和公开的辩论发送给其他国家,他们的意图清晰的和可靠的信息。 与此相反,它是很难知道的非民主国家领导人的意图,优惠将有什么样的影响,并承诺将保持。 因此会有不信任,不愿意做出让步,如果双方在争议中至少有一个是一个非民主国家( 2003年征费及拉辛)。


编辑 ]生物

鸽子
20,20 80,40
鸽子 40次,80 60,60
鹰鸽博弈

与经济不同的是,在生物学游戏的支付通常被解释为相应的健身 。 此外,重点一直不太平衡是相对应的一个概念,理性的,而是由进化的力量上,将保持。 最有名的平衡在生物学中被称为进化稳定策略 (ESS),并首次引进( 史密斯和1973年价格 )。 虽然其最初的动机并没有涉及任何的心理需求的纳什均衡 ,每一个ESS是一个纳什均衡。

在生物学上,博弈论已经用于,明白许多不同的现象。 它最初是用来解释的演变(稳定)的性别比例约为1:1 。 ( 费舍尔1930 ),1:1的性别比例是一个进化的力量作用于个人谁可以被看作是试图最大限度地提高他们的孙子。

此外,生物学家们利用演化博弈论和ESS解释动物的出现通信 ( 哈珀·梅纳德·史密斯2003 )。 信号传递博弈的分析和其他通信游戏进化的动物之间的沟通提供了洞察。 在大量的猎物攻击较大的食肉动物,有许多种,例如, 聚众滋扰行为似乎是自发紧急组织的一个例子。 蚂蚁也被证明具有前馈的行为类似于时尚, 蝴蝶经济学 。

生物学家已经用来分析打斗行为和属地的游戏 [ 引用 ]

梅纳德·史密斯, 演变和博弈论的序言中写道:“奇怪的是,它已经变成了博弈论是更适用于生物学,而不是经济行为的领域,它最初设计的”。 演化博弈理论被用来解释许多看似不协调的自然现象[19] 。

一个这样的现象被称为生物的利他主义 。 这是一种情况,即出现一个生物体作用的方式,有利于其他生物体和本身是有害的。 这是明显的利他主义的传统观念,因为这样的行为是不自觉的,但似乎是进化的适应化修改,以提高整体健康。 实例可以被发现的物种范围从吸血蝙蝠,吐出血,他们已经获得一个晚上的狩猎和给该组的成员谁已经失败养活,工蜂,护理的女王蜂为他们的整个生活和从来没有交配,以黑长尾猴,警告捕食者的方法组成员,即使它危害,个人的生存机会。 [20]所有这些行动提高整体健康的一个群体,但发生在个别成本。

进化博弈论解释这种利他主义的亲属选择的想法。 利他主义者歧视的个人,他 ??们帮助和青睐亲属之间。 汉密尔顿的规则解释的进化推理后面这个选择与方程?<B?* R在那里的成本(C)利他主义者必须是小于的利益(B)到的收件人乘以的相关性系数的相关(r)。 更密切相关的两种生物的利他主义导致的发病率增加,因为他们有着许多相同的基因。 这意味着利他个体,通过确保其近亲的等位基因被传递,(通过它的后代的生存)可以放弃具有后代本身的选项,因为相同的等位基因数被传递。 帮助兄弟姐妹(在二倍体的动物),例如有?系数,因为(平均)个人股?的等位基因在其兄弟姐妹的后代。 确保是足够的一个兄弟的后代生存到成年排除的利他主义的个体产生后代的必要性。 [20]该系数的值取决于大量运动场上的范围,例如,如果的选择,其中有利于包括所有遗传生活的东西,不是所有的亲戚,我们假设所有的人仅占约1%,在比赛场上的多样性之间的差异,高效,?在较小的领域变为0.995。 同样,如果它被认为是一种遗传性质(例如,表观遗传学,宗教,科学,等)以外的信息通过坚持比赛场仍然变大的时间,和小的差异。


编辑 ]计算机科学与逻辑

已经到了博弈论中扮演着越来越重要的作用,在逻辑计算机科学 。 几个逻辑理论有一个在游戏中的语义基础。 此外,计算机科学家们游戏互动计算模型。 另外,博弈论领域的多智能体系统提供了理论依据。

此外, 在线算法博弈论发挥了重要作用。 特别是,的K表-服务器问题 ,其中有在过去被称为作为游戏与移动成本和要求,回答游戏 (本大卫,鲍罗廷与卡普等, 1994 )。 姚明的原则是一个博弈论技术为证明随机化算法计算复杂性 ,特别是在线算法的下界。

对互联网的出现促使算法的发展,在游戏中寻找平衡,市场,计算拍卖,对等系统,以及安全和信息市场。 算法博弈论 [21] ,并在它的算法机制设计 [22]合并计算的算法设计和分析复杂系统与经济理论[23]


编辑 ]哲学

雄鹿 野兔
雄鹿 3,3个 0,2
野兔 2,0 2,2个
鹿狩猎

博弈论已经被付诸的几个用途哲学 。 应对WVO奎因 ( 1960年 , 1967年 ), 刘易斯(1969 )用博弈论发展的哲学思考公约的两篇文章。 在这样做时,他首先分析了常见的知识,并雇用它在,分析发挥协调游戏 。 此外,他建议,人们可以理解意义信号传递博弈 。 这以后的建议一直奉行的几个哲学家,因为刘易斯( Skyrms(1996年 ),严峻,Kokalis和阿莱-Tafti的等人( 2004年 ))。 ·刘易斯(1969年 )博弈论的帐户公约,的埃德娜·乌尔曼马加利特(1977)和Bicchieri (2006年)制定的社会规范 ,将其定义为纳什均衡理论,从混合动力的游戏转化成一个协调博弈的结果。 [24] [25]

博弈论也面临哲学家的互动认识论认为:这是什么意思的集体有共同的信仰或知识,和代理之间的互动产生的社会后果,这方面的知识会带来什么后果。 哲学家在这方面的工作包括Bicchieri(1989,1993), [26] Skyrms (1990), [27]斯塔尔内克 (1999)。 [28]

道德 ,一些[ 谁? ]作者试图追求的项目,由托马斯·霍布斯(Thomas Hobbes)开始,从自身利 ??益所产生的道德。 由于像囚徒困境的游戏呈现明显的道德和自身利 ??益之间的冲突,解释为什么合作是必需的自身利 ??益,是这个项目的重要组成部分。 这一总体战略的一个组成部分在政治哲学社会契约观(示例,请参见戈捷(1986年 )和卡夫卡(1986)。 [29]

其他作者试图用进化博弈理论在解释人的道德态度和相应的动物行为的出现。 这些作者看几场比赛,包括囚犯的困境, 鹿狩猎 ,并在纳什讨价还价的游戏提供一个解释为对道德的态度的出现(见,例如,Skyrms( 1996年 , 2004年 )和清醒和威尔逊( 1999年 ))。

一些[  ]假设在一些有哪些?博弈论的部分已在哲学的挑战; 心理利己主义状态,理性降低到自身的利益要求之间的辩论哲学家。 ( 见心理利己主义的批评 )


编辑 ]类型的游戏
编辑 ]合作或非合作
主要文章: 合作博弈非合作博弈

游戏是合作的,如果球员能够形成具有约束力的承诺。 例如,法律制度,要求他们遵守自己的诺言。 在非合作的游戏,这是不可能的。

通常情况下,它假定允许玩家之间的沟通合作游戏,但没有不合作的。 但是,这种分类对两个二进制标准受到质疑,有时拒绝( 海萨尼1974年 )。

的两种类型的游戏中,非合作游戏是能够模拟的最细微的细节的情况下,产生准确的结果。 合作游戏专注于游戏大。 已作出相当大的努力,链接的两种方法。 所谓的纳什方案[ 澄清 ]已经建立了许多非合作均衡的合作解决方案。

混合游戏包含合作和非合作的元素。 比如,在合作游戏的玩家的联盟形成,但这些在非合作的方式发挥。


编辑 ]对称和非对称

? F
? 1,2 0,0
F 0,0 1,2
一个非对称博弈

主要文章: 对称游戏

对称式的游戏是一个游戏,扮演一个特定的策略只依赖于其他策略,而不是谁打他们的支付。 如果身份的玩家可以改变不改变的回报的策略,那么游戏是对称的。 许多常见的研究2×2游戏是对称的。 对称博弈的囚徒困境 ,  , 鹿狩猎的标准表示。 有些人[ 谁? ]学者们考虑到某些不对称的游戏,这些游戏的例子。 然而,最常见的为每个这些游戏的回报是对称的。

研究最常用的的不对称游戏是游戏里有没有相同的策略集为双方球员。 例如,在最后通牒博弈 ,同样的独裁者游戏,每个玩家有不同的策略。 这是可能的,但是,对于一个游戏为双方球员有相同的策略,但是不对称的。 例如,游戏右图是不对称的,尽管有相同的策略集为双方球员。


编辑 ]零和非零和

-1,1 3,-3
0,0 -2,2
零和游戏

主要文章: 零和游戏

零和游戏是一种特殊情况的常数和游戏,在选择的球员可以既不增加,也不减少可利用的资源。 在零和游戏的所有玩家在游戏中的总收益,每个组合的策略,始终为零(非正式的,玩家只有在平等的牺牲别人利益)。 扑克体现了一个零和游戏(忽略房子的切割的可能性),因为人赢正是金额的对手输了。 其他的零和游戏,包括匹配便士和最经典的棋盘游戏,包括围棋国际象棋 。

许多游戏的的游戏理论家(包括臭名昭著的囚徒困境 )研究的是非零和游戏,因为结果有净结果大于或小于零。 非正式的,在非零和游戏中,一个球员的收益并不一定对应的另一个亏损。

恒和游戏对应盗窃和赌博等活动,但没有基本的经济情况,其中有潜在的贸易收益 。 它可以把任何游戏(可能是不对称)“零和”游戏,通过增加一个额外的虚拟球员(通常被称为“板”),其损失补偿玩家的净赢。


编辑 ]同时和顺序
主要文章: 序贯博弈

同时游戏是游戏,两个玩家同时移动,或者,如果他们不同时,后来的玩家都知道早期玩家的行为使他们有效地同时序贯博弈 (或动态游戏)游戏后玩家有一些了解早期行动。 这就需要早期玩家的每一个动作,没有完善的信息 ,它可能是所知甚少。 例如,玩家可以知道,较早的球员没有执行一个特定动作,虽然他不知道其他可用的行动,实际执行的第一个球员。

同时和顺序的游戏之间的差异被捕获在上面讨论的不同的表示形式。 通常, 正常的形式来表示同时进行游戏,和广泛的形式是用来表示顺序的。 转变粗放型向正常形式是单向的,也就是说多个粗放型游戏的对应相同的正常形式。 因此,同时进行游戏平衡的概念是不够的推理序贯博弈的子博弈完美 。


编辑 ]完善的信息和不完全信息


不完全信息的博弈(虚线表示无知的球员 ??,正式命名为一个信息集 )

序贯博弈的一个重要子集包括游戏, 完美的信息 。 游戏是一个完善的信息,如果所有的玩家都知道所有其他球员的移动。 因此,只有序贯博弈是完全信息的游戏,因为玩家同时进行游戏,不知道其他球员的行动。 博弈论研究的是,大多数游戏不完全信息博弈。完美信息博弈的有趣的例子包括的最后通牒游戏蜈蚣博弈 。 完美信息博弈的休闲游戏,包括国际象棋 ,  ,和宝石棋 。 许多纸牌游戏是游戏的不完全信息,例如扑克桥牌 。

完善的信息与完整的信息 ,这是一个类似的概念经常被混淆。 完整的资料,需要每个球员都知道的策略和支付给其他玩家,但不一定采取的行动。 游戏不完整的信息,可以减少,但是,游戏的不完全信息引入“ 移动的性质 “( 莱顿-布朗2008年及Shoham ,页60)。


编辑 ]组合游戏

游戏的难度,找到一个最佳的战略源于多种可能的行动被称为“组合游戏”。 例子包括国际象棋和围棋。 游戏涉及不完善或不完整信息的,也可能有一个强大的组合字符,比如步步高 。 组合元素在游戏中,没有一个统一的理论。 然而,有数学工具,可以解决特定的问题,并回答一般性的问题。 [30]

游戏完美的信息进行了研究, 组合博弈论 ,开发出新颖的陈述,如超现实的数字 ,以及组合代数 ( 有时 )证明非建设性的方法来解决某些类型的游戏 ,包括“空军基地的”游戏可能会导致无限长序列的动作。 这些方法,具有较高的组合的复杂性游戏比那些通常被认为是在传统的博弈论(或“经济”)。 [31] [32]已经解决了这样的游戏,是一个典型的十六进制 。 借鉴相关领域的研究, 计算复杂性理论 ,是游戏的复杂性 ,关注的是估计的计算难度找到最佳的战略。 [33]

人工智能的研究都已经解决了健全和不完善或不完整的信息,游戏,有没有可证明的最优策略已发现的非常复杂的组合结构(如象棋,围棋,或西洋双陆棋)。 切实可行的解决方案涉及计算的启发式,如alpha-beta剪枝或使用的人工神经网络训练的强化学习 ,使游戏更容易处理,在计算实践。 [30] [34]


编辑 ]无限长的游戏
主要文章: 确定性

游戏,作为研究的经济学家和真实世界的游戏玩家,一般完成了在有限多个移动。 纯数学家,特别是研究游戏设置理论家 ,无限多的动作,不知道,直到完成后,所有这些举措都与冠军(或其他收益)。

关注的焦点通常是没有那么多,什么是最好的方式玩这样的游戏,但根本上或其他播放器是否有一个成功的策略 。 (可以证明,使用选择公理 ,有游戏,甚至完全信息,而其中唯一的结果是“双赢”或“输”, 既不球员有一个成功的策略。)的存在,例如策略上,巧妙设计的游戏,在描述集理论有重要的影响。


编辑 ]离散和连续的游戏

博弈论关心的是有限的,离散的游戏,有一个有限数量的球员 ??,动作,事件,结果等许多概念可以被延长,但是持续的游戏让玩家选择一个连续的策略集的策略。 例如,通常是仿照古诺竞争与球员的策略是任何非负量,包括分数的数量。


编辑 ]微分对策

球员的状态变量的演化是由微分方程, 微分对策,如连续追逃游戏是连续的游戏。 在不同游戏中找到一个最佳的战略是密切相关的问题的最优控制理论。 特别是,有两种战略:开环的策略,利用Pontryagin最大值原理,闭环策略的使用Bellman的动态规划方法。

特定情况下的微分博弈的游戏,随机的时间跨度。 [35]在这样的游戏中,终端的时间是一个随机变量与一个给定的概率分布函数。 因此,玩家最大化的数学的成本函数的预期 。结果表明,修改后的优化问题可以重新作为贴现微分博弈在无限的时间间隔。


编辑 ]许多玩家和人口的游戏

游戏与玩家任意的,但数量有限,通常被称为n人游戏( 1957卢斯和瑞发 )。 演化博弈论认为游戏涉及人口的决策者,其中一个特别作出决定的频率会发生变化。响应时间在人群中的所有个人作出的决定。 在生物学上,这是为了模型(生物) 进化 ,基因编程的生物以及他们的一些战略规划他们的后代。 同样的理论在经济学中,是为了把握人口变化,因为人们玩的游戏,多次在他们的一生中,自觉地开关(也许是合理的)策略( 韦伯,2007 )。


编辑 ]随机成果(和关系到其他领域)

个人决策问题的随机结果有时被认为是“游戏”。 这些情况都没有考虑一些作者的游戏理论。[ 谁? ]他们可能会使用类似的工具在相关学科的决策理论 , 运筹学建模,领域,特别是人工智能 AI规划的不确定性和多代理系统 。 虽然这些领域可能有不同的动机,所涉及的数学大致相同,如利用马尔可夫决策过程 (MDP)[ 引用 ]

随机的结果,也可以模拟在博弈论方面加入一个随机作用的球员 ??“的机会动作”,也被称为“ 移动的性质 “( 1994年奥斯本和鲁宾斯坦 )。 这个播放器通常不被认为是第三个球员是什么,否则两个玩家的游戏,但仅用于提供一卷要求的情况下本场比赛的骰子。

对于某些问题,不同的方法来建模随机结果可能会导致不同的解决方案。 例如,的MDP和极值解的方法之间的差异在于,后者认为最坏的情况下,通过一组敌对行动,而不是在一个固定的概率分布这些举措的预期推理。 的极大极小方法可能是有利的随机模型的不确定性是不可用的,但也可能是高估的可能性微乎其微,但昂贵的事件,极??大地摇曳的战略,在这样的情况下,如果假定攻击??者可以强制一个事件的发生。 [36] (黑天鹅理论 ,这种建模问题的讨论,特别是因为它涉及到投资银行的预测和限制损失。)

一般模式,包括随机的结果,对手,其他球员的移动部分或嘈杂的可观测性()的所有元素也进行了研究。 认为是部分可观察随机游戏 (POSG)的“ 金标准 “ ,但一些现实的问题是计算可行的POSG表示。 [36]


编辑 ]Metagames

这些都是游戏的发挥,这是发展的另一场比赛,目标或主题的游戏规则。 Metagames争取最大限度的规则集的实用价值。 机制设计理论的理论metagames有关。

这个词也可以用来指少之又少分析 ,以务实的态度开发的奈杰尔·霍华德( 霍华德1971 ),据此,利益相关者的战略游戏中,可供他们选择的方式,尝试去实现自己的目标的情况下被诬陷为。 随后的事态发展已导致制定的对抗分析 。


编辑 ]历史


约翰·冯·诺伊曼

早期的例子,两个人的游戏的讨论很久以前发生的崛起现代数学的博弈论。 博弈论的第一个已知的讨论发生在詹姆斯·沃尔德格雷夫在1713年写的一封信。 在这封信中,沃尔德格雷夫提供一个极小极大 混合策略的解决方案,以两个人的版本的卡片游戏勒她 。 詹姆斯·麦迪逊做了什么,我们现在可以预期的行为根据不同的系统识别为一个博弈论分析的方法征税。 [37] [38]在他的1838 秘密武器“SUR LES principesmathématiques德拉théorie德richesses(财富理论的数学原理研究到 ), 安托万·奥古斯丁古诺认为是一种双寡头垄断 ,并提出一个解决方案,这是一个限制版, 纳什均衡 。

丹麦数学家的措伊滕证明的数学模型有一个成功的策略,利用Brouwer的不动点定理 。 在他1938年出版的应用程序辅助JEUX去Hasard和更早的笔记, 波莱尔的二人零和矩阵的游戏,只有当放矩阵是对称的,证明了极小极大定理。 波莱尔推测,不存在混合策略均衡的二人零和游戏,会出现一个猜想被证明是错误的。

博弈论不真正存在作为一个独特的领域,直到约翰·冯·诺伊曼发表了一份文件,1928年。 [39]冯·诺伊曼的原证明使用Brouwer的不动点定理连续映射到紧凸集,它成为一个标准的方法在博弈论和数理经济学 。 他的论文其次是他1944年的著作游戏论与经济行为 ,与奥斯卡·摩根斯 ??坦 ,考虑合作博弈的几名球员。 这本书的第二版提供了一个不言自明的预期效用理论,数理统计学家和经济学家治疗不确定性下的决策。 冯·诺伊曼的博弈论最终游戏理论与经济行为由冯·诺伊曼和奥斯卡·摩根斯 ??坦在1944年的书。 此基础工作包含的二人零和游戏中找到了相互一致的解决方案的方法。 [40]在这段时间内,工作主要集中在博弈论合作博弈理论,分析了最优策略组个人,假定他们可以强制执行正确的策略,他们之间的有关协议。

1950年, 囚徒困境的出现,第一次讨论和实验工作是由著名的数学家美林M.洪水梅尔文Dresher ,作为博弈论的兰德公司(Rand Corporation)的调查的一部分。 兰德公司追求的研究,因为全球核战略可能的应用。 [41]大约在同一时期, 约翰·纳什制定了一个玩家的战略相互一致的标准,被称为纳什均衡,比标准提出适用于更广泛的游戏由冯·诺伊曼和摩根斯坦。 这种平衡是足够一般,让合作的非合作博弈分析。

博弈论经历了一系列活动,在20世纪50年代,在这段时间内的核心概念, 粗放型游戏 , 虚构的播放 , 重复的游戏 ,和Shapley值 。 此外,博弈论哲学政治学的第一个应用程序在这段时间内发生的。

1965年, 莱因哈德·泽尔腾介绍了他的解决方案概念子博弈完美均衡 ,从而进一步完善了纳什均衡(后来他将介绍颤抖的手完美 )。 在1967年, 约翰·海萨尼开发完整的信息贝叶斯游戏的概念。 纳什,泽尔腾和海萨尼成为1994年诺贝尔经济学奖得主对经济博弈论的贡献。

在20世纪70年代,博弈论广泛应用于生物学 ,这主要是由于工作的约翰·梅纳德·史密斯和他的进化稳定策略 。 此外, 相关均衡 ,颤抖的手完美, 知识常见的概念[42]进行了介绍和分析。

在2005年,游戏理论家托马斯·谢林罗伯特·奥曼跟随诺贝尔奖获得者纳什,泽尔腾和海萨尼。 谢林工作的动态模型, 演化博弈论的早期例子。 奥曼的贡献平衡学校,粗化,相关均衡,发展广泛的正式分析的常识和其后果的假设引入一个平衡点。

2007年, 列昂尼德·赫维茨 , 埃里克·马斯金 , 罗杰·迈尔森 ,被授予诺贝尔经济学奖“ 机制设计理论奠定了基础。“ 迈尔森的贡献,包括适当的平衡的概念,一个重要的研究生教材: 博弈论分析冲突 ( 迈尔森1997 )。 赫维茨的概念正式的激励相容 。


编辑 ]流行文化


问题的书new.svg
本节的主题下属的 主要来源或来源 。 依赖于 请添加引用 可靠和独立的来源 。(2012 年10月)

游戏理论家和数学家约翰·纳什的生活故事变成一个传记片, 罗素·克劳主演,根据同名书,由张艾嘉纳萨尔 美丽心灵 。 [43]

“游戏论”,“博弈论”中提到的军事科幻小说“ 星河战队罗伯特·A·海因莱因 。 [44]在1997年的电影同一个名字的人物卡尔·詹金斯是指他的任务,军事情报, “游戏理论”。


编辑 ]参见
AI效果
人工智能的应用
连锁悖论
对抗分析
组合博弈论
博弈论的术语
家庭内部的谈判
量子博弈论
理性
反向博弈论
自确认均衡
Parrondo的悖论

列表


新兴技术清单
在博弈论中的游戏名单
人工智能概况
编辑 ]
^ 罗杰·B.迈尔森 (1991)。 博弈论分析冲突,哈佛大学出版社,页1 。 章节预览链接,第VII喜 。
^ RJ奥曼 ( [1987] 2008)。 “博弈论”简介, “新帕尔格雷夫经济学大辞典 (第二版)。 摘要。
^ 科林·F.卡默勒 (2003)。 行为博弈论:战略互动的实验中 ,第5-7(滚动到1.1什么是博弈论适合? )。
^ 罗斯,唐。 “博弈论” 。 斯坦福哲学百科全书“(2008年春季版)。 爱德华:N. Zalta(编辑 。 检索2008-08-21。
^ 试点工作在博弈论中有很多名字, 实验经济学 , 行为经济学 , 行为博弈论有好几个。 最近的讨论,请参见:科林·F.卡默勒(2003)。 行为博弈论:战略互动实验 (描述介绍 ,25页)。
?在 JEL:C7中国的经济文献分类代码。 
RJ奥曼 (2008)。 “博弈论”,“新帕尔格雷夫经济学大辞典 (第二版)。 摘要。 
马丁舒贝克 (1981)。 “博弈论模型和政治经济学方法”在,编辑肯尼思·阿罗和迈克尔Intriligator的。,“数理经济学 ,第1,第285 -330。 
卡尔·夏皮罗 (1989年)。 论“的经营策略,” 兰德经济学 ,20(1),第125-137。
^ 在使用博弈论的企业并购 N. Agarwal和P. Zeephongsekul学院,数学与地理信息科学,墨尔本皇家理工大学, 心理定价
^ ?, LEIGH Tesfatsion (2006年) “基于Agent的计算经济学:对经济理论的一种建设性的方式,”通道。 16日,“计算经济学 ,第2,第831 -880页。 
约瑟夫·Y.哈尔彭 (2008年)。 “计算机科学与博弈论,” 新帕尔格雷夫经济学大辞典 (第二版)。 摘要 。
?从 “新帕尔格雷夫经济学大辞典 (2008年),第2版: 
罗杰·B.迈尔森 。 “机制设计”。 摘要 。 
_____。 “启示的原则。” 摘要 。 
?Tuomas的桑德霍尔姆。 “机制设计计算。” 摘要。 
诺姆·尼散月和阿米尔RONEN(2001年)。 “算法机制设计”, 游戏和经济行为 ,35(1-2),页166-196 。 
诺姆·尼散 等 。编辑。 (2007年)。 算法博弈论 ,剑桥大学出版社。 说明 。
^ R. 奥曼和S.哈特,编,1994年。“博弈论与经济应用 ,第2节,概要链接,CH。 30:“表决程序”和CH。 31: “社会选择。”
弗农·史密斯 ,1992年。 “博弈论与实验经济学:入门和早期的影响,”ER温特劳布,编辑, 建立一个博弈论的历史 ,第241 - 282。 
_____,2001年。 “实验经济学”, 国际社会与行为科学百科全书 ,第5100-5108页。摘要每教派。 1.1和2.1。 
查尔斯·R·普洛特和弗农·史密斯,编,2008年。“实验经济学结果 ,第1节,爱思唯尔,第4部分,游戏,CH。 45-66预览链接 。 
?文森特P.克劳福德(1997年)。 “理论与实验分析中的战略互动,” 在经济学和计量经济学:理论与应用 ,第206-242 。 剑桥。 科林·F.的卡默勒等人 ,编重印。 (2003年)。 行为经济学 ,普林斯顿大学。 1986-2003年论文的描述 , 内容预览。,普林斯顿大学,CH。 12。 
?马丁舒贝克,2002年。 “博弈论与实验游戏”R.奥曼和S.哈特,编辑,“博弈论与经济应用程序 ,爱思唯尔,第3节,第2327至2351年。 摘要 。
^ 从“新帕尔格雷夫经济学大辞典 (2008年),第2版: 
法鲁克居尔 。 “行为经济学和博弈论”。 摘要。 
科林·F.卡默勒 。 “行为博弈论”。 摘要。 
?_____(1997年)。 “行为博弈论的进展,” 中国经济展望 ,11(4),P。 172,第167-188页 。 
_____(2003年)。 行为博弈论 ,普林斯顿大学。 描述 , 预览 ([CTRL] +)和CH。 1 链接 。 
_____, 乔治·洛文斯坦 ,和马修·拉宾 ,编辑。 (2003年)。 行为经济学 ,普林斯顿大学。 1986至2003年的论文描述 , 内容预览 。 
?: 德鲁弗登伯格 (2006)。 “更进一步”行为经济学进展 “, 中国经济文学 ,44(3),第694 -711。
^ ?:埃里克Rasmusen(2007)。 游戏和信息 ,第4版。 描述和章节预览链接。 
大卫·克雷普斯 (1990)。 博弈论与经济模型 描述。 
?R.奥曼和S.哈特,编辑。 (1992年,2002年),“博弈论与经济应用诉 1,滚动勾勒链接, CH。 3-6和第3节, CH。 43 。
^ ? 让·梯若尔 (1988),产业组织理论 ,麻省理工学院出版社, 描述和章节预览链接,第VII-IX“ ,“组织通则”,页5-6 ,和“非合作博弈理论:A用户指南手册“,”胆固醇。 11,第423-59页 。 
?凯尔的Bagwell和Asher Wolinsky(2002年)。 “博弈论与产业组织,”胆固醇。49,“博弈论与经济应用程序 ,第3节,第1851 -1895。 
?马丁舒贝克(1959)。 战略和市场结构的竞争,寡头垄断,博弈论 ,威利。 说明和审查提取物 。 
?_____:理查德·列维坦(1980)。 市场结构和市场行为 ,哈佛大学出版社出版。 回顾提取物 。
?马丁舒贝克(1981)。 “博弈论模型和政治经济学方法”,“数理经济学 ,第1,第285 -330页。 
?_____(1987)。 政治经济学的博弈理论的角度看 。 麻省理工学院出版社。 说明 。
?马丁舒贝克(1978)。 “博弈论:经济应用”中,编辑W.克鲁斯卡尔和JM Tanur的。 统计 , 国际百科全书 ,第2,第372-78页。 
罗伯特?奥曼和塞尔久哈特版“博弈论与经济应用程序 (可滚动的章节大纲或抽象的链接):

1992年 1 ,1994年 2 ,2002。  3。


^ 博弈论模型来研究两个权衡中采集的信息进行了认真的平衡研究论文欧洲工商管理学院(INSEAD)
^ 选项游戏平衡的灵活性和承诺之间的权衡
^ 进化博弈论(斯坦福哲学百科全书)
 b 生物利他主义(斯坦福哲学百科全书)
^ 诺姆·尼散等 ,编。 (2007年)。 算法博弈论 ,剑桥大学出版社。 说明 。
尼散月,诺姆RONEN,阿米尔(2001) “的算法机制设计” 。 游戏和经济行为35(1-2):
约瑟夫·Y.哈尔彭 (2008年)。 “计算机科学与博弈论,” 新帕尔格雷夫经济学大辞典 (第二版)。 摘要 。 
?Shoham,YOAV(2008年), “计算机科学与博弈论” 。 通讯的ACM 。 
? 利特曼,:艾米(2007年)。 “学习与计算博弈论”的特刊上机学习 67(1-2):3-6 DOI : 10.1007/s10994-007-0770-1 。
^ 乌尔曼马加利特,E.(1977)。 规范的出现 。 牛津大学出版社, ISBN 0198244118
^ Bicchieri,C.(2006)。 社会语法的性质和动态的社会规范 。 剑桥大学出版社ISBN0521573726 。
^ “自辩理论的战略互动的悖论常识”。Erkenntnis 30(1):69-85。 1989年:10.1007/BF00184816 。 的合理性和协调 。 剑桥大学出版社。 1993年, 国际标准书号 0521381231 。
^ 动力学的理性思考 。 哈佛大学出版社出版。 1990年, 国际标准书号 067421885X 。
^ Bicchieri,克里斯蒂娜,理查德·杰弗里Skyrms,布莱恩,主编。 (1999年)。 “知识,信仰和反事实推理游戏” 的战略逻辑 。 纽约:牛津大学出版社, ISBN:0195117158 。
^ 如需更详细的讨论使用博弈论的道德哲学的入门博弈论和道德的斯坦福百科全书。
^ 约尔格Bewersdorff (2005年)。 运气,逻辑,和白色的谎言:数学游戏 。 AK彼得斯有限公司。 第IX-12和第31章。 国际标准书号 978-1-56881-210-6 。
^ 伟业,迈克尔·H. ; Nowakowski,理查德·沃尔夫,大卫(2007年)。 在播放的教训:在组合博弈论 。 AK彼得斯有限公司第3-4页。 国际标准书号 978-1-56881-277-9 。
^ 贝克,约瑟夫 (2008年)。 组合游戏的tic-tac-脚趾理论 。 剑桥大学出版社。 第1-3页。 ISBN 978-0-521-46100-9 。
^ 罗伯特·A·赫恩埃里克·D. Demaine(2009)。 游戏,拼图,和计算 。 AK彼得斯有限公司。 ISBN 978-1-56881-322-6 。
^ M. 蒂姆·琼斯(2008年)。 人工智能:一种系统方法 。 琼斯和巴特利特学习。 106-118。 ISBN 978-0-7637-7337-3 。
^ Petrosjan,LA和Murzov,NV(1966)的游戏力学的理论问题 。 里托夫斯克。 垫。锑。 6,423-433(俄罗斯)。
^ 休·布伦丹·麦克马汉(2006), 域名的随机结果,对手和部分可观察性 ,CMU-CS-06-166的强大的规划中 ,第3-4页
^ 詹姆斯·麦迪逊,美国的政治制度的罪恶月,1787年。 链接
^ 杰克Rakove,“詹姆斯·麦迪逊和”宪法“, 历史 ,第13期2007年9月链接
^ 纽曼,J.诉(1928)。 “祖尔理论之Gesellschaftsspiele。” 数学因素Annalen100(1):295-320。 DOI : 10.1007/BF01448847 。 英语翻译: 塔克,AW卢斯,RD,主编。 (1959)。 “策略游戏”的理论 。 博弈论的贡献 。4。 页。
^ 伦纳德(2010),罗伯特· 冯·诺伊曼,摩根斯 ??坦,和创新的博弈 。 纽约:剑桥大学出版社, ISBN 9780521562669 。
^ http://plato.stanford.edu/entries/prisoner-dilemma/
^ 虽然常识的哲学家大卫·刘易斯在他的论文(以及后来的书)“在20世纪60年代末第一次讨论,但它并没有被广泛认为由经济学家罗伯特·奥曼 ,直到在20世纪70年代的作品。
^ 西尔维亚纳萨尔, “美丽心灵” (1998年)。 Simon&Schuster出版社ISBN 0-684-81906-6。
^ 罗伯特·A·海因莱因,(1959年)。 星河战队 。
编辑 ]参考和进一步阅读
参考和进一步阅读
编辑 ]的教科书和参考文献
奥曼,罗伯特·J. (1987年), 博弈论, 新帕尔格雷夫经济学大辞典 ,2期 ,页460-82 。
奥曼,罗伯特和塞尔久哈特版“博弈论与经济应用程序,可滚动章大纲或抽象的链接:

1992年 1
1994年 2
2002年 3。


新帕尔格雷夫经济学大辞典 (2008年)。 第2版??:

“博弈论”由罗伯特·J.奥曼。 摘要。
“博弈论在经济,起源,”由罗伯特·伦纳德。 摘要。
“行为经济学和博弈论” 法鲁克居尔 。


,科林·卡梅拉 (2003), 行为博弈论在战略互动的实验 ,拉塞尔·塞奇基金会, ISBN 978-0-691-09039-9 描述介绍 ,第1-25页。
杜塔,Prajit K.(1999), 策略和游戏:理论与实践 , 麻省理工学院出版社 , ISBN 978-0-262-04169-0 。 适用于本科和商学院学生。
费尔南德斯,L F.·比尔曼,H S.(1998), 博弈论与经济上的应用 , Addison-Wesley出版 , ISBN 978-0-201-84758-1 。 适用于上层大学生。
弗登伯格,德鲁· 让·梯若尔 (1991), 博弈论 ,麻省理工学院出版社, ISBN 978-0-262-06141-4 。 广受好评的参考文本。 描述。
吉本斯,罗伯特·D.(1992年), 博弈论的应用经济学家 , 普林斯顿大学出版社出版 , ISBN 978-0-691-00395-5 。 适用于高年级本科生。


在欧洲出版的罗伯特·吉本斯(2001年), 博弈论的底漆 ,伦敦, ISBN 978-0-7450-1159-2 :收割机Wheatsheaf 。


,赫伯特金蒂斯(2000), 博弈论不断发展的:以问题为中心引进战略行为建模 ,普林斯顿大学出版社, ISBN 978-0-691-00943-8
绿色,杰瑞R. MAS-Colell,安德鲁温斯顿,迈克尔·D.(1995年), 微观经济理论“, 牛津大学出版社 , ISBN 978-0-19-507340-9 。 博弈论在正式的方式,适用于研究生水平的。
编辑,佩尔·汉森由Vincent F.亨德里克斯。 (2007年),汉森,佩尔G.;亨德里克斯,文森特号,EDS, 博弈论:5个问题 ,纽约,伦敦:自动出版社, ISBN 978-87-991013-4-4 / VIP 访谈片段 。
霍华德,奈杰尔(1971), 理性的悖论:游戏,Metagames,政治行为 ,剑桥,马萨诸塞州:麻省理工学院出版社, ISBN 978-0-262-58237-7
艾萨克斯,鲁弗斯 (1999年), 微分对策:战争与追求,控制和优化 ,纽约: 多佛出版社 , ISBN 978-0-486-40682-4 的数学理论与应用
莱顿-布朗,凯文Shoham,YOAV(2008年), 博弈论的要点:简明,多学科的介绍 ,加利福尼亚州San Rafael:摩根克莱普尔出版社, ISBN 978-1-59829-593-1 。 一个88页的数学介绍,在许多大学的免费在线 。
詹姆斯·H.(2003年), 博弈论在工作中如何使用游戏的理论,outthink和策略制胜的竞争 ,纽约: 麦格劳-希尔 ,米勒, ISBN 978-0-07-140020-6 。 适用于普通观众。
罗杰·B.迈尔森 (1991年), 博弈论分析冲突 , 哈佛大学出版社 , ISBN 978-0-674-34116-6
奥斯本,马丁·J.(2004年), 博弈论的介绍 ,牛津大学出版社, ISBN 978-0-19-512895-6 。 本科教材。
Papayoanou,保罗(2010年), 商业博弈论 ,概率出版, ISBN 978-0-9647938-7-3 。 底漆的业务男性和女性。
彼得罗相,莱昂(系列3)优化,Zenkevich,尼古拉(1996年), 博弈论 ,世界科学出版社, ISBN 978-981-02-2396-0
马丁J.奥斯本,阿里尔·鲁宾斯坦 (1994年), 博弈论的课程 ,麻省理工学院出版社, ISBN 978-0-262-65040-3 。 一个现代引进的研究生水平。
威廉·庞德斯通,(1992年), 囚徒困境:约翰·冯·诺伊曼,博弈论和之谜的炸弹 ,锚, ISBN 978-0-385-41580-4 。 博弈论的一般历史和游戏理论家。
Rasmusen,埃里克(2006年), 博弈论 (第4版),Wiley-Blackwell出版, ISBN 978-1-4051-3666-2 游戏信息:
Shoham,YOAV莱顿-布朗,凯文(2009), 多智能体系统的算法,游戏理论,逻辑基础 ,纽约: 剑桥大学出版社 , ISBN 978-0-521-89943-7 。 从计算的角度来看一个全面的参考, 免费在线下载 。
威廉姆斯,约翰·戴维斯(1954年)(PDF), 的Compleat Strategyst:游戏战略的理论基础知识 ,圣莫尼卡:兰德公司, ISBN 978-0-8330-4222-4 称赞引物和通俗的介绍给大家,从来没有售完。
罗杰·麦凯恩的博弈论: 一个非技术性的战略分析 (修订版)
克里斯托弗·格里芬(2010) 博弈论:宾夕法尼亚州立大学数学486讲义 ,第169页,CC-BY-NC-SA协议,适合本科生介绍
韦伯,詹姆斯·N.(2007年), 博弈论的决定,相互作用和演化 ,施普林格本科数学系列,施普林格, ISBN 1-84628-423-6 一致的方式处理要求的游戏类型,通常由不同的应用领域,例如马氏决策过程 。
约瑟夫·E·哈林顿(2008) 游戏,战略,决策 ,价值, ISBN 0-7167-6630-2 。 在应用领域的本科生教材,无数的例子,减少形式主义的概念介绍。
编辑 ]历史上重要的文本
奥曼,RJShapley值,LS (1974年), 价值观的非原子游戏 ,普林斯顿大学出版社
奥古斯丁古诺,A. (1838),“Recherches SUR LES原则mathematiques德拉théorie德richesses”,Libraire科学politiques等社会 (巴黎:M.里维埃和C.ie的)
埃奇沃斯,弗朗西斯Y. (1881), 数学灵媒 ,伦敦:Kegan保罗
Farquharson,知更鸟 (1969), 投票理论 ,布莱克韦尔(耶鲁大学在美国), ISBN 0-631-12460-8
瑞发 卢斯,R.邓肯 ,德怀特-霍华德 (1957年), 游戏和决定:引进和关键的调查 ,纽约: 威利


重印版:R. 邓肯·卢斯,霍华德瑞发(1989), 游戏和决定:引进和关键调查结果显示 ,纽约: 多佛出版社 , ISBN 978-0-486-65943-5


约翰·梅纳德·史密斯 (1982年), 演化和博弈论 , 剑桥大学出版社 , ISBN 978-0-521-28884-2
约翰·梅纳德·史密斯 价格,乔治·R. (1973),“动物冲突的逻辑”, 自然 246(5427):15-18, Bibcode 1973Natur.246 ... 15S , DOI :10.1038/246015a0
纳什,约翰 (1950年), “平衡点在n人游戏” , 美国国家科学院的美国美国 36(1):
Shapley值,LS(1953)的值n人游戏,在理论第二卷,HW库恩和AW塔克(编辑)
Shapley值,LS(1953年),随机的游戏,美国国家科学院的科学Vol。 39卷,第1095至1100年。
,约翰·冯·诺伊曼(1928年),“祖尔理论之Gesellschaftsspiele”,“ 数学因素Annalen 100“(1): p。 295 -320。 英语翻译:“在理论的策略游戏,”AW Tucker和RD卢斯,编辑。 (1959年), 博弈论 ,第4,第p 13 - 42。普林斯顿大学出版社出版。
,约翰·冯·诺伊曼 ,奥斯卡·摩根斯 ??坦 (1944), 博弈论与经济行为“ , 普林斯顿大学出版社
策梅罗,安永会计师事务所 (1913年),“超级EINE适用车型德Mengenlehre奥夫模具Theorie德Schachspiels”, 重要的第五届国际数学家大会 2:501-4
编辑 ]其他打印引用
本·大卫,S.; 鲍罗廷,亚伦 ,理查德·卡普 ;,G. Tardos; Wigderson,A. (1994), “在电源的随机在线算法” (PDF),Algorithmica 11(1):2 -14, DOI: 10.1007/BF01294260
Bicchieri,克里斯蒂娜 (1993,第2版,1997年), 合理性和协调 , 剑桥大学出版社 , ISBN 0-521-57444-7
安东尼·唐斯 (1957年), 民主的经济理论 ,纽约:哈珀
戈捷,大卫 (1986), 德协议 , 牛津大学出版社 , ISBN 978-0-19-824992-4
艾伦·Gibbard ,“操纵投票的计划:一般结果”,计量经济学方法。 41,第4号(1973年),第587-601页。
严峻,帕特里克Kokalis,天合光能;阿莱Tafti,阿里Kilb,尼古拉斯·圣丹尼斯,保罗(2004年),“的含义发生”, 中国人工智能实验与理论 16(4):209-243, DOI: 10.1080/09528130412331294715
哈珀,大卫·梅纳德·史密斯,约翰 (2003年), 动物信号 ,牛津大学出版社, ISBN 978-0-19-852685-8
约翰·C·海萨尼, (1974),“一个平衡点的稳定集的解释”, 管理科学 20(11):1472年至1495年, DOI : 10.1287/mnsc.20.11.1472
征费,吉来特拉辛,汤家骅(2003), “难兄难弟:民主和平论”的解释 , 工作文件
刘易斯,大卫 (1969年), 公约的哲学研究 ISBN 978-0-631-23257-5 (2002年版)
麦当劳,约翰(1950 - 1996), 扑克,商业与战争策略 , WW Norton出版社 , ISBN 0-393-31457-X 。 一个外行的介绍。
WVO奎因 (1967),“真理公约”,Philosophica散文AN怀特海 ,罗素和罗素出版社, ISBN 978-0-8462-0970-6
WVO奎因 (1960),“卡尔纳普和逻辑真理”,SYNTHESE 12(4):350-374, DOI : 10.1007/BF00485423
马克A.萨特思韦特,的“战略proofness和箭头的条件:存在性和对应定理表决程序及社会福利函数”, 经济理论杂志“,10(1975),187-217。
齐格弗里德,汤姆(2006年), 一个美丽的数学 ,约瑟夫·亨利出版社, ISBN 0-309-10192-1
Skyrms,布莱恩 (1990年), 动态的理性思考“, 哈佛大学出版社 , ISBN 0-674-21885-X
,布赖恩Skyrms(1996), 社会契约论的演变 ,剑桥大学出版社, ISBN 978-0-521-55583-8
,布赖恩Skyrms(2004年), 鹿狩猎和社会结构的演变 ,剑桥大学出版社, ISBN 978-0-521-53392-8
清醒,埃利奥特·威尔逊,大卫·斯隆(1998年), 向他人无私的行为和心理的演变 ,哈佛大学出版社, ISBN 978-0-674-93047-6
萨尔,罗伯特·M. 卢卡斯的威廉F. (1963),“ ? 人游戏在分区函数形式“, 海军研究物流季刊”,10(4):281-298, DOI : 10.1002/nav.3800100126
编辑 ]网站
保罗-沃克: 历史博弈页 。
大卫·莱文: 博弈论。 论文,讲义和更多的东西。
阿尔文罗斯: 博弈论与实验经济学 -博弈论信息在网络上的综合列表
亚当·卡莱: 博弈论和计算机科学 -博弈论和计算机科学讲义。
迈克·肖尔: 博弈论。网 -讲义,互动的图片和其它信息。
吉姆·拉特利夫在博弈论研究生课程 (讲义)。
唐·罗斯: 博弈论在斯坦福哲学百科全书 。
布鲁诺·维贝克和克里斯托弗·莫里斯: 博弈论与道德
埃尔默G.的威恩斯: 博弈论 -简介,工作的例子,玩在线二人零和游戏。
马立克M.卡明斯基: 博弈论与政治 -对博弈论和政治学的教学大纲和讲义。
博弈论和社会互动的网站
Kesten绿色的冲突预测 - 从博弈论和其他方法的预测的准确性证据 证明文件 。
麦凯尔维,理查德·D·麦克伦南,安德鲁·M. Turocy,西奥多·L.(2007年) 开局:博弈论的软件工具 。
本杰明·波拉克: 在耶鲁大学 的课程视频 公开课博弈论
本杰明·莫里茨,伯恩哈德K?nsgen,丹尼Bures的,罗尼Wiersch,(2007年) Spieltheorie Software.de:博弈论的应用程序在Java中实现 。

[hide]
v 
  
 ?
博弈论中的主题
定义
普通形式的游戏 
 粗放式博弈 
 合作博弈 
 简洁的游戏 
 信息集 
 信仰的层次结构 
 偏爱
平衡的 概念
纳什均衡 
 子博弈完美 
 Mertens的稳定平衡 
 贝叶斯-纳什 
 完美贝叶斯 
 颤抖的手 
 适当的平衡 
 ε-平衡 
 相关均衡 
 序贯均衡 
 准完美的平衡 
 进化稳定策略 
 风险优势 
 核心 
 Shapley值 
 帕累托效率 
 量子反应平衡 
 自确认均衡 
 强大的纳什均衡 
 马尔可夫完美均衡
策略
占优策略 
 纯策略 
 混合策略。 
 针锋相对 
 严峻的触发 
 共谋 
 逆向归纳法 
 远期感应 
 马氏战略
类的游戏
对称游戏 
 完善的信息 
 同时游戏 
 序贯博弈 
 重复博弈 
 信号博弈 
 不负责任的言论 
 零和游戏 
 机制设计 
 谈判问题 
 随机游戏 
 大泊松游戏 
 不可传递游戏 
 全球游戏
游戏
囚徒困境 
 旅行者的困境 
 协调博弈 
  
 蜈蚣博弈 
 志愿者的困境 
 美元拍卖 
 两性之战 
 鹿狩猎 
 匹配便士 
 最后通牒游戏 
 纸剪刀 
 海盗游戏 
 独裁者游戏 
 公共品博弈 
 烂醉如泥的游戏 
 消耗战 
 EL的Farol酒吧问题 
 切蛋糕 
 古诺游戏 
 僵局 
 晚餐的困境 
 猜猜三分之二的平均 
 库恩扑克 
 纳什讨价还价博弈 
 筛选游戏 
 囚犯和帽子谜的 
 信托游戏 
 公主和怪物的游戏 
 蒙提霍尔问题
定理
极小极大定理 
 纳什定理 
 净化定理 
 民间定理 
 启示录原则 
 阿罗的不可能定理
关键数字
肯尼斯·阿罗 
 罗伯特·奥曼 
 肯尼思·宾默尔 
 塞缪尔·鲍尔斯 
 梅尔文Dresher 
 美林M.洪水 
 德鲁弗登伯格 
 唐纳德B.吉利斯 
 SANJEEV戈亚尔 
 约翰·海萨尼 
 列昂尼德·赫维茨 
 大卫K.莱文 
 丹尼尔·卡尼曼 
 哈罗德·W·库恩 
 埃里克·马斯金 
 让-弗朗索瓦·梅尔滕斯 
 保罗·米尔格罗姆 
 奥斯卡·摩根斯 ??坦 
 罗杰·迈尔森 
 约翰·纳什 
 约翰·冯·诺伊曼 
 阿里尔·鲁宾斯坦 
 托马斯·谢林 
 莱因哈德·泽尔腾 
 赫伯特·西蒙 
 劳埃德·夏普利 
 约翰·梅纳德·史密斯 
 让·梯若尔 
 阿尔伯特·W塔克 
 威廉·维克瑞 
 罗伯特·B·威尔逊 
 佩顿青年 
 赫伯·科恩
参见
公地悲剧 
 暴政的小决定 
 全支付拍卖 
 在博弈论中的游戏名单 
 对抗分析
[hide]
v 
  
 ?
数学 领域

算术 
 代数学 
 初级 
 线性 
 多线性 
 抽象 
 几何 
 分离 
 代数 
 差动 
 有限 
 微积分 / 分析 
 集理论 
 逻辑 
 分类理论 
 数论 
 组合数学 
 图论 
 拓扑 
 李理论 
 差分方程 / 动力系统 
 数学物理 
 数值分析 
 计算 
 信息理论 
 可能性 
 数理统计 
 数学优化 
 控制理论 
 博弈论
分部
纯粹数学 
 应用数学 
 离散数学 
 计算数学

类别 
 数学门户网站 
 概述 
 列表




 

  评论这张
 
阅读(291)| 评论(0)
推荐

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017