注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

柳州文铮

CANTOR SET&ART

 
 
 

日志

 
 

贝叶斯博弈Bayesian game股票数学模型对冲基金方法  

2012-11-07 15:56:10|  分类: 股票数学模型对冲 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |


在广泛的形式表示一个贝叶斯博弈,不完全信息

博弈论 ,的贝叶斯博弈是信息的其他球员的特点(即回报)是不完整的 。 约翰·C·海萨尼的框架, [1]一个贝叶斯博弈可以仿照作为一个球员在一场比赛中通过引入自然。自然分配一个随机变量,这可能需要为每个玩家的类型和相关联的概率值的概率密度函数与那些类型(在游戏过程中 , 自然随机选择的概率分布跨越所述的类型为每个玩家每个玩家每个球员的空间)。 海萨尼的方法,一个贝叶斯博弈模型以这样的方式成为游戏的游戏不完整的信息的不完全信息(在历史的游戏提供给所有玩家)。 的播放机的类型决定了该玩家的支付功能和与类型相关联的概率的概率是人类型被指定的播放器是该类型的。 在贝叶斯博弈,信息的不完备性是指,至少有一个球员是不确定的另一名球员的类型(支付功能)。

这种游戏被称为贝叶斯因为在游戏中固有的概率分析。 玩家们最初的信念,每个球员的类型(其中一种信念是可能的类型的球员 ??的概率分布),可以更新自己的信念,根据贝叶斯法则发挥在比赛中发生,即一个玩家拥有的信念另一名球员的类型可能会发生变化的基础上,发挥他们的行动。 由于信息缺乏,播放器和建模的信念的意思是,这样的比赛也被用来分析不完全信息的情况。

规格的游戏

在的非贝叶斯博弈与完善的信息正常的形式表示一个规范的战略空间和支付函数的球员 ??。 对于一个球员的策略是一个完整的行动计划,涵盖每一个应急的比赛中 ,即使该应急永远不会出现。 的战略空间,这样的球员是所有战略的一组可用的球员。 支付函数是从组策略配置文件的回报(通常是实数集),其中的策略配置文件是一个向量,指定每一个球员的策略。

在贝叶斯博弈,这是必要的,以指定的战略空间,类型空间,支付函数和信念,每一个球员。 对于一个球员的策略是一个完整的,涵盖每一个可能出现的每一个类型的球员可能的应急行动计划。 战略必须不仅播放器的类型,他是指定动作,但必须指定,他将采取的行动,如果他是另一种类型的。 战略空间如上述所定义的。 A型空间的球员 ??只是该玩家所有可能的类型的集合。 一个球员的信念描述的该玩家类型的其他球员的不确定性。 每个信仰是特定类型的其他玩家的概率,给定类型的球员与信念(即信念是 P(\的MBOX {类型的其他球员\的mbox {} |这个播放器类型})) 。 支付函数是一个功能的战略配置文件和类型2的地方。 如果一个玩家支付函数 U(X,Y) 他收到的回报是,他有T型, U(x ^ *,T) ,其中 X ^ * 就是这一策略配置文件在比赛中发挥(即矢量演奏的策略)。

这样的游戏之一的形式化定义看起来像下面这样:

该游戏被定义为: 摹= \ langle?,\欧米茄\ langle A_I,T_i,u_i的,\ tau_i,p_i,C_i \ rangle_ {I \ N} \ rangle ,其中

1。 ? 是一组玩家。

2。 \欧米茄 是国家的性质。 例如,在一个纸牌游戏,它可以是任何顺序卡。

3。 A_I 是一组球员我的行动。 让 A = A_1 \倍A_2 \时期\ cdots \时期A_N 。

4。 T_i 是我的球员,由功能决定的类型 \ tau_i:\欧米茄\ RIGHTARROW T_i 。 因此,对于每一个国家的性质,本场比赛将有不同类型的球员。 是什么决定了它的类型的球员的结果。 播放器具有相同的结果属于相同类型。

5。 C_i \ \时期subseteq A_I T_i 定义可用的行动为某种类型的球员我 T_i 。

6。 u_i:\欧米茄\次A \ RIGHTARROW? 我为球员支付功能。 更确切地讲,让 L = \ {(\ OMEGA,A_1,\ ldots,A_N)\中期\ OMEGA \ \欧米茄\ FORALL我,(A_I,\ tau_i(\ omega)的C_i)\ \} ,和 u_i:L \ RIGHTARROW? 。

7。 p_i 的概率分布 \欧米茄 每个参与者i,也就是说,每个玩家有不同意见的概率分布状态的性质。 在游戏中,他们从来不知道的确切状态的性质。

纯策略 S_I:T_i \ RIGHTARROW A_I 应满足 (S_I(t_i),t_i)\ C_i 所有 t_i 。 因此,每个球员的策略不仅取决于他喜欢的类型,因为他可能没有任何知识对其他球员的类型。 和预期收益播放器 我 对于这样的策略配置文件是 u_i(S)= E_ {\ OMEGA \ SIM卡p_i} [u_i(\欧米茄,S_1(\ tau_1(\ OMEGA)),\ ldots,S_N(\ tau_N(\ OMEGA))) 。

让 S_I 是的纯策略, S_I = \ {S_I RIGHTARROW A_I:T_i \ \中期(S_I(t_i),t_i的的)\ C_i,\对所有t_i \}。

,游戏G被定义为一个贝叶斯均衡是一个(可能混合策略)纳什均衡的游戏 \帽子{G} = \ langle N,\帽子{A} = S_1 \倍S_2 \时期\ cdots \倍S_N,\帽子{U} = U \ rangle 。 因此,对于任何有限的比赛中G,贝叶斯平衡总是存在的。


编辑 ]信号

信令游戏构成贝叶斯游戏的一个例子。 知情人士(“代理”)在这样的游戏中,知道自己的类型,而不知情的一方(以下简称“委托人”)不知道(代理)类型。 在一些这样的游戏,主要是有可能的推断代理人的类型,根据该代理(在发送信号的主要形式),被称为一个“分离均衡”的行动。

一个信号博弈的一个具体例子是就业市场??的典范。 球员们的申请人(代理人)和用人单位(委托人)。 有两种类型的申请人,熟练和非熟练工人。 的申请人,用人单位不知道,但他不知道,90%的申请者技术不熟练和10%的技能(类型为“熟练”的概率为0.1和类型“不熟练”有一个0.9的概率)。

雇主的动作空间是自然数集,代表工资这些用来形成一个基于申请人预计将如何生产的合同。 支付较大的技术工人的工资,为雇主带来更大的回报,同时给予非技术工人的工资将有较明显的影响。 因此,通过申请人的技能(如果申请人接受了合同)和工资的雇主的回报。 最重要的是,根据他或她的信仰,如何熟练的申请人是通过由申请人送交的信号,这种信念在很大程度上取决于雇主选择他或她的行为(提供工资)。

申请人的行动空间是由两个动作组成:获得大学或放弃大学。 这是一个熟练的工人获得教育成本更低,因为他或她可能会收到奖学金,不征税,等等。 因此,大学教育是作为一个信号 ,与申请人沟通的雇主,他或她,其实是熟练的一种手段。

之一的战略用人单位可以使用的,是给所有申请人的工资,熟练的申请人可参加大学(由于其较低的成本),但是这是不够不熟练的申请人提供大学教育。 这将创建一个分离均衡:熟练的申请人现在可以去上大学,意味着他们的技能,和不熟练的申请人不能。 工人能够去上大学,然后就可以最大限度地发挥他或她的回报提供高工资的技术工人和低工资,不熟练的,用人单位可以观察到。


编辑 ]贝叶斯纳什均衡

在非贝叶斯博弈,策略配置文件是一个纳什均衡,如果该配置文件中的每一个战略是在配置文件中的每一个战略,即一个最好的回应 ,没有战略,一个球员可以发挥,将产生更高的收益,因为所有的其他球员发挥的策略。 在的贝叶斯博弈(球员被建模为风险中性),合理的球员正在寻求最大限度地发挥其预期收益,因为他们的信仰有关的其他玩家(在一般情况下,玩家们可能是风险规避或风险爱好,假设是玩家们的期望效用最大化 )。

一个贝叶斯纳什均衡的定义是每个球员的其他球员,每个球员他们的信仰其他玩家的类型和其他玩家所扮演的战略,最大限度地提高预期收益的类型指定的策略配置和信仰 。

该解决方案概念产生丰富的均衡,动感游戏,没有进一步的限制时,被放置在玩家的信念。 这使得贝叶斯纳什均衡的一个不完整的工具来分析不完全信息动态博弈。


编辑 ]完美贝叶斯均衡

贝叶斯纳什均衡结果在动态的游戏,让玩家轮流顺序,而不是同时在一些令人难以置信的平衡。 同样的,令人难以置信的平衡中可能出现的令人难以置信的纳什均衡同样的方式,出现在游戏中的完美和完整的信息,如令人难以置信的威胁和承诺 。 完美和完整的信息,游戏,应用子博弈完美纳什均衡,这种均衡可能会被淘汰。 然而,并不总是能够利用自己的这种解决方案的概念,在不完全信息博弈因为游戏包含非单身的信息集和子博弃 ,因为必须包含完整的信息集,有时是唯一的一个子博弈整场比赛,所以每平凡的子博弈完美纳什均衡。 即使游戏有一个以上的子博弈的子博弈完美的,无法通过削减信息集可能会导致令人难以置信的平衡不被淘汰。

要完善的的贝叶斯纳什解决方案的概念或子博弈完美的平衡点,我们可以利用完美贝叶斯均衡解的概念。 PBE是子博弈完美的精神,它要求后续的发挥是最佳的。 不过,它会将玩家的信念决定在非单身的信息集要处理的更圆满,使移动节点。

到目前为止,在讨论贝叶斯游戏,它已经被认为是完美的(或如果不完善的,玩为同声传译,我们可以在听广播或看电视或开会时)。 然而,在研究动态的游戏,它可能是必要的手段,不完全信息模型。 PBE得到这意味着玩家的地方信仰的节点上,出现在他们的信息集,这意味着,可以产生性质(在信息不完全的情况下)或其他玩家(在信息不完全的情况下)的信息集。


编辑 ]信仰系统

贝叶斯游戏的玩家举行的信念,可以接触更严格的PBE。 一个信仰体系是在游戏中的每一个节点的任何信息集的概率的总和为1的概率分配。 一个球员的信念,正是这些概率的节点中的所有信息集,该播放器具有移动(一个球员的信念可能被指定为他的信息从工会的功能设置为[0,1])。 一个信仰体系的概率的概率达到该节点的策略配置文件,即通过贝叶斯规则由系统分配到每个节点的计算方法为,当且仅当一个给定的策略配置文件是一致的。


编辑 ]连续理性

连续理性的概念是什么决定了随后的发挥PBE的最优性。 在一个特定的信息设置为一个特定的信仰体系的策略配置文件是连续理性的, 当且仅当播放器,其信息的设置(即谁拥有的举动,信息集)的预期收益是最大的,因为所有的策略发挥其他球员。 一个特定的信仰体系的策略配置文件是连续理性的,如果满足上述的每一个信息集。


编辑 ]定义

一个完美贝叶斯均衡是一种策略,这样的策略是连续理性的信仰体系和信仰体系是一致的,在可能的情况下,给定的策略配置文件的知名度和信仰体系。

这是必要的,以“尽可能”的条款规定,因为一些信息集可能无法达到给定的策略配置文件,因此贝叶斯规则不能被用来计算概率在这些集合中的节点。 说是这样的信息集的平衡路径,并可以分配给他们任何信仰。 进一步加强一致性的概念可以被分配到平衡的信息集的信念,以“合理”的限制。


编辑 ]例


在广泛的形式表示一个贝叶斯博弈,不完全信息

在游戏中,左边的是不完美的,因为球员不知道什么播放器1时,他玩。 如果双方都是理性的,都知道,双方的球员都是理性的,任何球员的一切,是被称为是每一个球员(即播放器1知道参与者2知道该玩家1是理性的和玩家2的知道这一点, 循环往复 -公共知识),将在游戏中扮演如下的精炼贝叶斯均衡:

播放器无法观察到播放器1的举动。 玩家想愚弄玩家以为他已经打ü时,他实际上起到D,使得该播放器将播放D'和播放器将接收3。事实上,有播放机1次和播放2次U'和玩家持有的信念,该 ??玩家肯定会玩D(即球员2个名额的概率为1的节点上达到一个完美贝叶斯均衡,如果玩家1次D)。 在这个均衡中,每个策略是合理的,给予持有的信念,每一个的信念是一致的战略发挥。 在这种情况下,完美贝叶斯均衡是唯一的纳什均衡。


编辑 ]
^ 约翰·C·海萨尼,,1968分之1967。 玩过的不完全信息贝叶斯播放器,I-III“游戏”。 管理科学14(3):159-183(第一部分),14(5):320-334(第二部分),14(7):486-502(第三部分)。

[hide]
v 
  
 ?
博弈论中的主题
定义
普通形式的游戏 
 粗放式博弈 
 合作博弈 
 简洁的游戏 
 信息集 
 信仰的层次结构 
 偏爱
平衡的 概念
纳什均衡 
 子博弈完美 
 Mertens的稳定平衡 
 贝叶斯-纳什 
 完美贝叶斯 
 颤抖的手 
 适当的平衡 
 ε-平衡 
 相关均衡 
 序贯均衡 
 准完美的平衡 
 进化稳定策略 
 风险优势 
 核心 
 Shapley值 
 帕累托效率 
 量子反应平衡 
 自确认均衡 
 强大的纳什均衡 
 马尔可夫完美均衡
策略
占优策略 
 纯策略 
 混合策略。 
 针锋相对 
 严峻的触发 
 共谋 
 逆向归纳法 
 远期感应 
 马氏战略
类的游戏
对称游戏 
 完善的信息 
 同时游戏 
 序贯博弈 
 重复博弈 
 信号博弈 
 不负责任的言论 
 零和游戏 
 机制设计 
 谈判问题 
 随机游戏 
 大泊松游戏 
 不可传递游戏 
 全球游戏
游戏
囚徒困境 
 旅行者的困境 
 协调博弈 
  
 蜈蚣博弈 
 志愿者的困境 
 美元拍卖 
 两性之战 
 鹿狩猎 
 匹配便士 
 最后通牒游戏 
 纸剪刀 
 海盗游戏 
 独裁者游戏 
 公共品博弈 
 烂醉如泥的游戏 
 消耗战 
 EL的Farol酒吧问题 
 切蛋糕 
 古诺游戏 
 僵局 
 晚餐的困境 
 猜猜三分之二的平均 
 库恩扑克 
 纳什讨价还价博弈 
 筛选游戏 
 囚犯和帽子谜的 
 信托游戏 
 公主和怪物的游戏 
 蒙提霍尔问题
定理
极小极大定理 
 纳什定理 
 净化定理 
 民间定理 
 启示录原则 
 阿罗的不可能定理
关键数字
肯尼斯·阿罗 
 罗伯特·奥曼 
 肯尼思·宾默尔 
 塞缪尔·鲍尔斯 
 梅尔文Dresher 
 美林M.洪水 
 德鲁弗登伯格 
 唐纳德B.吉利斯 
 SANJEEV戈亚尔 
 约翰·海萨尼 
 列昂尼德·赫维茨 
 大卫K.莱文 
 丹尼尔·卡尼曼 
 哈罗德·W·库恩 
 埃里克·马斯金 
 让-弗朗索瓦·梅尔滕斯 
 保罗·米尔格罗姆 
 奥斯卡·摩根斯 ??坦 
 罗杰·迈尔森 
 约翰·纳什 
 约翰·冯·诺伊曼 
 阿里尔·鲁宾斯坦 
 托马斯·谢林 
 莱因哈德·泽尔腾 
 赫伯特·西蒙 
 劳埃德·夏普利 
 约翰·梅纳德·史密斯 
 让·梯若尔 
 阿尔伯特·W塔克 
 威廉·维克瑞 
 罗伯特·B·威尔逊 
 佩顿青年 
 赫伯·科恩
参见
公地悲剧 
 暴政的小决定 
 全支付拍卖 
 在博弈论中的游戏名单 
 对抗分析

  评论这张
 
阅读(333)| 评论(0)
推荐

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017