博弈论基础复习

  • 格式:docx
  • 大小:18.85 KB
  • 文档页数:11

下载文档原格式

  / 11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《博弈论基础》主要知识点

一、名词解释(5 X 2 = 10分)

策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。

纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。

混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规分析工具。

博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。

完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。

逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。

冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。

信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,

分别称为信号发出方和信号接收方。

分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率i选

择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。

特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种

集合函数,称为特征函数。

联盟

_ 、选择题(5X2 = 10分)

三、简答题(28-30 分)

1. 博弈的分类及相关概念。

合作博弈:强调效率、公正、公平

非合作博弈:博弈论的主要研究对象,强调在互动假设下的个人理性、个人最优决策

从信息角度看,博弈可分为:

完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。

不完全信息博弈:从局中人行动的先后顺序看,博弈可分为:

静态博弈:局中人同时选择行动;

动态博弈:局中人的行动有先后顺序,且后行动者可以观察到先行动者的行动后再行动。

2•描述双人策略型(标准型)博弈的基本结构及其纳什均衡。如何理解纳什均衡?能够举例说明。

3. 分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境

4. 博弈说明了什么问题?经济学中智猪博弈的应用

5. 描述双人策略型博弈的纯策略和混合策略

6. 对于多重纳什均衡,有哪些抉择方法?举例说明。

帕累托优势标准,風險优势标准

(1 )分钱博弈:两人分配100块钱,每人独自提岀一个要价份额,若要价之和没有超过100,则每个人得到自己要求的份额,否则什么都得不到。

在分钱博弈中,纳什均衡有无重多个:只要两人要价之和恰为100的要价组合均为一个纳什均

衡。在实验研究中,不同的国家有不同的结果。实验对象的文化背景、、生活习惯、性别等有关。

在现实生活中,参与人可能选用某些被博弈模型抽象掉的信息以达到一个聚点均衡。这些信

息可能与过去的文化、习惯、生活经历及博弈历史等有关。分钱博弈中各方岀价50元即为一个聚点均衡。

风险占优均衡与帕累托最优均衡:共同投资问题:n家公司决定是联盟投资一个大项目(成

功时收益为R),还是各自投资一个小项目(收益为r , R> nr )。只有当所有公司都投资于大

项目时,大项目才能成功。该博弈到少有两个纯策略纳什均衡:都投资于大项目或都投资于小

项目。前者是帕累托最优均衡,后者是风险占优均衡。

7. 简要分析序惯决策博弈(博弈树)的构成要素。如何描述其均衡?

8. 描述蜈蚣博弈。它有何启示?(P151-P155)

9. 理解完全信息动态博弈下的信息集、纯策略和行动

10. 什么是冷酷(触发)策略?谈谈你对重复博弈中冷酷策略的理解

(1)腔发策咯;如果一方采駭兀合作的铢略另一方随即也采取不合作策略并且永远采取不合作策略F

臥牙还牙t重复的博笄珪i仑上导致了合作的产生,但是谁也不能保证合作的魅续,因为之前已经说过,合作的代桥是建立在损害个人利益基础之上的。如臬个人放弃未来收益或当前脊叛收益大于未来收益,背扳的风险优然存在。孙么在重复博弈中怎样的策略才是最优“若干睿智而复杂在经过计算机中卩K之后. 极其廈始的杯以牙换牙"策略脱颖而岀,固黴这个策略简单至极,其咸力却无穷I —旦重复错条中岀现一欢(也许不经意的)背叛*那据此原则行事的博弈将永无止境的背扳下去,十人利益极度膨胀的同时I集休利益无限衰微。

11•什么是子博弈和子博弈精炼(完美)纳什均衡?什么是完美信息博弈?简析完美信息博弈中逆向归纳法的求解思路。

子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结

(包括终点结)组成的能自成一个博弈的原博弈的一部分。

12. 博弈论中对不完全信息是通过类型来处理的,对类型,你是如何理

解的?举例分析。

13. 什么是信号传递博弈?针对信号发送者有两种类型,了解分离均衡

和混同均衡。

态博弈模型。信号博弈的基本特征是两个(或两类,每类又有若干个)博弈方。分别称为信号发岀方(sender)和信号接收方(Receiver)。他们先后选择一次行为,其号接收方具有不完全信息, 但他们可以从信号发岀方的行为中获得部分信息,信号发岀方的行为对信号接收方来说是一种(以某种方式)反映其有关得益信息的信号。这也正是这类博弈被称为“信号博弈”的原因。

14. 比较合作博弈和非合作博弈

Word 资料

相关主题