(完整版)博弈论基础复习
- 格式:doc
- 大小:2.19 MB
- 文档页数:11
博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
名词解释:1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。
那么该事件就是共同知识。
2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。
这种局中人先动得益大于后行得益的情况,叫做先动优势。
3,后动优势:后行动的得益比先行动的得益大的情况4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。
•单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。
•触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。
•冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。
即任何局中人的一次性不合作将触发永远不合作。
•礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。
触发策略是带有奖励和惩罚措施的一种博弈机制。
在这个机制中,惩罚措施是其中的关键。
注意:(1),一个信息集罩住的必须是同一个局中人的决策点。
•必须是同一个局中人在同一个时点的决策节点。
同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。
因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。
简答题:1,博弈的构成要素:•局中人决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。
完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。
混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。
博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树。
完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。
行为策略是指每一个参与人在每一个信息集上随机的选择行动。
逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。
联盟二、选择题(5×2=10分)三、简答题(28-30分)1.博弈的分类及相关概念。
1、博弈方:独立决策、独立承担博一结果的个人或组织一、单人博弈——只有一个博弈方的博弈二、两人博弈两个博弈方的利益方向可能一致掌握信息多的博弈方并不一定保证利益也较多个人追求最大自身利益的行为,常常并不能导致实现社会的最大利益,也常常不能真正实现个人自身的最大利益三、多人博弈可能存在破坏者:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响多人博弈的表示问题:得益矩阵、扩展形、描述、函数等2、博弈中的策略策略:博弈中各博弈方的选择内容。
(定性定量、简单复杂、对称不对称。
存在理解和建模选择)不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个3、博弈中的得益得益:各博弈方从博弈中所获得的利益。
也是各博弈方追求的根本目标及行为和判断的主要依据零和博弈:也称为“严格竞争博弈”。
博弈方之间利益始终是对立的,偏好通常不同—猜硬币,田忌赛马,石头-剪刀-布常和博弈:博弈方之间利益的总和为常数。
博弈方之间的利益是对立的且是竞争关系—分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
—囚徒困境、产量博弈、制式问题等4、博弈的过程静态博弈:所有博弈方同时或可看作同时选择策略的博弈动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能有限次重复博弈、无限次重复博弈完全信息静态博弈属于非合作博弈最基本的类型。
只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能5、通过严格下策重复剔除的均衡一定是纳什均衡,但并非每个纳什均衡都是上策均衡或重复剔除的均衡。
博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。
而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。
2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。
3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。
非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。
4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。
如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。
5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。
6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。
7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。
8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。
9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。
博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。
在博弈论中,决策者被称为玩家,他们的决策会受到其他玩家的影响。
以下是博弈论的一些重要知识点的总结:1.资料和约定-玩家:博弈论中的决策者。
-策略:玩家可以采取的行动。
-支付:玩家根据博弈结果获得的效用或价值。
-最优策略:在给定博弈条件下,可以使玩家获得最大效用的策略。
-纯策略和混合策略:纯策略是指玩家在每次博弈中都采取相同的行动;混合策略是指玩家以一定概率采取不同的行动。
2.标准形博弈-扩展形式:博弈者按照时间次序做出决策,每个决策节点有多个玩家可以选择的动作。
-纳什均衡:在标准形博弈中,如果所有玩家都不愿意单方面改变他们的策略,则该策略组合是纳什均衡。
-最优反应函数:针对每个玩家的策略组合,最优反应函数给出了该玩家的最佳策略。
-支配策略:一个策略在任何情况下都能够给出玩家更好的结果,那么我们可以说这个策略是支配的。
3.矩阵博弈-矩阵:博弈论中描述玩家策略和效用的表格。
-矩阵博弈的解:通过找到纳什均衡,我们可以得出矩阵博弈的解决方案。
-互动博弈:双方玩家的效用都取决于对方的策略选择。
4.博弈树-博弈树:根据博弈的时间顺序和玩家之间的相互影响,构建的树形结构。
-极小极大算法:用于确定博弈树上的最佳策略。
- alpha-beta剪枝:通过剪枝,减少博弈树的节点数量,从而提高效率。
5.进化博弈论-重复博弈:博弈过程被连续重复进行,玩家可以根据之前的结果来调整策略。
-演化稳定策略:一个策略集合中的策略,在当前环境下被所有玩家采纳并且难以被其他策略取代。
6.合作博弈论-合作博弈:玩家可以自由选择与其他玩家联合合作,并共享所获得的效用。
-特征函数:描述合作博弈的效用分配。
-核心:合作博弈中所有合法的效用分配的集合。
- Shafer值:一种用于将效用分配给个体的方法,使得每个个体的效用都能够得到公平分配。
博弈论是多学科交叉的研究领域,应用广泛,涉及经济、管理、政治等多个领域。
博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。
一种是“进化博弈论方法”。
它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。
另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。
其中局中人、策略和收益是最基本要素。
局中人、行动和结果被统称为博弈规则。
博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。
完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
博弈论看法博弈论的基本假设:参与人追求利润最大化。
博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
《初级博弈论》课程期末复习资料一、客观部分:(单项选择、多项选择、不定项选择、判断)(一)、判断题★考核知识点:博弈方的策略和得益,★考核知识点:两人博弈★考核知识点:静态博弈与动态博弈概念★考核知识点:完全信息博弈的概念★考核知识点:上策均衡★考核知识点:严格下策反复消去法★考核知识点:纳什均衡的一致预测性质★考核知识点:混合策略和严格下策反复消去法★考核知识点:动态博弈的非对称性★考核知识点:纳什均衡的问题★考核知识点:子博弈的概念★考核知识点: 重复博弈的策略、子博弈和均衡路径★考核知识点:唯一纯策略纳什均衡博弈的有限次重复博弈★考核知识点:两人零和博弈的无限次重复博弈★考核知识点:子女对父母的赡养义务★考核知识点:ESS的概念★考核知识点:囚徒的困境★考核知识点:两人博弈★考核知识点:单人博弈★考核知识点:博弈方的能力和理性★考核知识点:上策均衡的概念★考核知识点:严格下策的概念★考核知识点:一致预测的概念★考核知识点:混合策略和严格下策反复消去法★考核知识点:动态博弈的策略和结果★考核知识点:子博弈的概念★考核知识点:子博弈完美纳什均衡的概念★考核知识点:重复博弈的概念★考核知识点:两人零和博弈的有限次重复博弈★考核知识点:无限次重复博弈★考核知识点:有限理性博弈分析框架★考核知识点:ESS的概念★考核知识点: 囚徒的困境★考核知识点: 赌胜博弈★考核知识点: 博弈过程★考核知识点: 非合作博弈的概念★考核知识点: 严格下策的概念★考核知识点: 纳什均衡的一致预测性质★考核知识点: 上策均衡和纳什均衡的关系★考核知识点: 上策均衡和帕累托最优的均衡,★考核知识点: 相机选择和策略中的可信性问题,★考核知识点: 逆推归纳法★考核知识点: 子博弈的概念★考核知识点: 重复博弈的得益★考核知识点: 有限次重复博弈★考核知识点: 触发策略★考核知识点: 有限理性博弈分析框架★考核知识点: ESS的概念,二、主观部分:(一)、简答★考核知识点:游戏与博弈附2.1.1(考核知识点解释)游戏和博弈的共同特征:①都有一定的规则,规定游戏的参加者可以做什么,不可以做什么,应当按怎样的顺序做,什么时候游戏结束或一旦参加者犯规怎样处罚。
博弈论复习题及答案博弈论是研究决策者在相互影响的情况下如何做出决策的理论。
以下是一些博弈论的复习题及答案,供学习者参考:一、选择题1. 博弈论中最基本的博弈类型是什么?A. 零和博弈B. 非零和博弈C. 完全信息博弈D. 不完全信息博弈答案: A. 零和博弈2. 在博弈论中,纳什均衡指的是什么?A. 一种博弈的最终结果B. 一种博弈的初始状态C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果D. 一种策略组合,其中所有参与者都希望改变策略以获得更好的结果答案: C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果3. 囚徒困境中,两个囚犯的最优策略是什么?A. 相互合作B. 相互背叛C. 一个合作,一个背叛D. 一个背叛,一个合作答案: B. 相互背叛二、简答题1. 解释什么是“混合策略”并给出一个例子。
答案:混合策略是指参与者在博弈中选择不同策略的概率分布。
例如,在石头、剪刀、布的游戏中,一个玩家可能会以1/3的概率选择石头,1/3的概率选择剪刀,和1/3的概率选择布,这就是一个混合策略的例子。
2. 描述什么是“重复博弈”以及它与单次博弈的区别。
答案:重复博弈是指同样的博弈结构在一定时间内多次进行。
与单次博弈相比,重复博弈允许参与者根据对手过去的行动来调整自己的策略,这可能会导致合作行为的出现,因为参与者会考虑到未来博弈的潜在收益。
三、论述题1. 论述博弈论在经济学中的应用,并给出至少两个具体的例子。
答案:博弈论在经济学中有广泛的应用。
例如:- 拍卖理论:博弈论可以用来分析拍卖中的竞价行为,确定最优的拍卖机制。
- 竞争策略:企业在制定市场进入、定价和广告策略时,会使用博弈论来预测竞争对手的行为并做出相应的决策。
2. 讨论囚徒困境在现实世界中可能的应用场景,并解释为什么合作有时是困难的。
答案:囚徒困境在现实世界中的应用场景包括但不限于:- 国际关系:国家之间的军备竞赛可以看作是囚徒困境的一种形式,合作减少军备可以带来共同的利益,但由于缺乏信任,每个国家都倾向于增加自己的军备。
总复习内容一、静态博弈部分1、纯策略均衡的博弈模型---------“囚徒”困境博弈需要解决的问题:要求会画支付矩阵、分析博弈的结果(即均衡分析)、会通过博弈分析的方法,解决与这类博弈相同或相近的实际问题,就是由此博弈衍生出来的问题,就所谓制度、规则等对于结果的重要性分析。
2、混合策略博弈模型要求:懂得如何判断什么情况下博弈属于混合策略博弈------即博弈没有纯策略博弈存在的情况下,就转化成混合策略博弈。
要求:会计算混合策略的概率罪犯不盗 盗巡逻 警察休息要求:会用混合策略博弈的原理解释“监管者与被监管者”之间博弈过程中的制度安排,以避免管理中“激励悖论”问题。
二、动态博弈部分1、要求:熟悉动态博弈的概念、博弈方策略、支付的表达形式,即博弈树或扩展型。
2、要求:弄懂博弈树中信息节点处的数字含义。
如:3、通过博弈树的研究分析,能找到动态博弈的均衡路径或者叫策略均衡4、能解释一些其他由此衍生出的博弈问题。
三、合作博弈问题1、弄清楚合作博弈与非合作博弈的区别与联系以及它们之间的转化条件2、合作博弈的利益分配和成本分担问题3、合作博弈联盟的规模及稳定性问题分析。
博弈根据是否可以达成具有约束力的协议分为合作博弈和非合作博弈。
合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
合作博弈采取的是一种合作的方式,或者说是一种妥协。
妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。
这种剩余就是从这种关系和方式中产生出来的,且以此为限。
至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。
因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。
在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。
合作博弈是研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
而非合作博弈是研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。
博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
《博弈论基础》主要知识点
一、名词解释(5×2=10分)
策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。
混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。
博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树。
完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。
行为策略是指每一个参与人在每一个信息集上随机的选择行动。
逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。
联盟
二、选择题(5×2=10分)
三、简答题(28-30分)
1.博弈的分类及相关概念。
合作博弈:强调效率、公正、公平
非合作博弈:博弈论的主要研究对象,强调在互动假设下的个人理性、个人最优决策从信息角度看,博弈可分为:
完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。
不完全信息博弈:从局中人行动的先后顺序看,博弈可分为:
静态博弈:局中人同时选择行动;
动态博弈:局中人的行动有先后顺序,且后行动者可以观察到先行动者的行动后再行动。
2.描述双人策略型(标准型)博弈的基本结构及其纳什均衡。
如何
理解纳什均衡?能够举例说明。
3.分析两人两策略博弈构成囚徒困境博弈应满足的条件。
囚徒困境
4.博弈说明了什么问题?经济学中智猪博弈的应用。
5.描述双人策略型博弈的纯策略和混合策略。
6.对于多重纳什均衡,有哪些抉择方法?举例说明。
帕累托优势标准,風險优势标准
(1)分钱博弈:两人分配100块钱,每人独自提出一个要价份额,若要价之和没有超过100,则每个人得到自己要求的份额,否则什么都得不到。
在分钱博弈中,纳什均衡有无重多个:只要两人要价之和恰为100的要价组合均为一个纳什均衡。
在实验研究中,不同的国家有不同的结果。
实验对象的文化背景、宗教、生活习惯、性别等有关。
在现实生活中,参与人可能选用某些被博弈模型抽象掉的信息以达到一个聚点均衡。
这些信
息可能与过去的文化、习惯、生活经历及博弈历史等有关。
分钱博弈中各方出价50元即为一个聚点均衡。
风险占优均衡与帕累托最优均衡:共同投资问题:n家公司决定是联盟投资一个大项目(成功时收益为R),还是各自投资一个小项目(收益为r ,R>nr )。
只有当所有公司都投资于大项目时,大项目才能成功。
该博弈到少有两个纯策略纳什均衡:都投资于大项目或都投资于小项目。
前者是帕累托最优均衡,后者是风险占优均衡。
7.简要分析序惯决策博弈(博弈树)的构成要素。
如何描述其均衡?
8.描述蜈蚣博弈。
它有何启示?(P151-P155)
9.理解完全信息动态博弈下的信息集、纯策略和行动。
10.什么是冷酷(触发)策略?谈谈你对重复博弈中冷酷策略的理解。
11.什么是子博弈和子博弈精炼(完美)纳什均衡?什么是完美信息
博弈?简析完美信息博弈中逆向归纳法的求解思路。
子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。
12.博弈论中对不完全信息是通过类型来处理的,对类型,你是如何
理解的?举例分析。
13.什么是信号传递博弈?针对信号发送者有两种类型,了解分离均
衡和混同均衡。
“信号博弈”(Signa1ing Game),是研究具有信息传递特征的信号机制的一般非完全信息动态博弈模型。
信号博弈的基本特征是两个(或两类,每类又有若干个)博弈方。
分别称为信号发出方(sender)和信号接收方(Receiver)。
他们先后选择一次行为,其中信号接收方具有不完全信息,但他们可以从信号发出方的行为中获得部分信息,信号发出方的行为对信号接收方来说是一种(以某种方式)反映其有关得益信息的信号。
这也正是这类博弈被称为“信号博弈”的原因。
14.比较合作博弈和非合作博弈。
15.理解联盟、特征函数、分配(效用配置)、夏普利值等概念:夏普
利值的相关运用
16.几种主要的拍卖方式分析:特点、含义、适用领域与模型分析。
公开竞价拍卖
最高价格公开出价拍卖(英国式拍卖):买者自由地提高自己的出价
降价式拍卖(荷兰式拍卖):卖者不断降低自己的要价
密封价格拍卖
一级密封价格拍卖(最高价格密封出价拍卖)
二级密封价格拍卖(维克瑞拍卖,次高价格密封出价拍卖)
17.讨价还价问题的纳什均衡解。
P312
四、计算题(40-42分)
1.用划线法和一阶条件法求解纳什均衡(纯策略和混合策略):如古
诺竞争博弈
2.博弈树与标准式博弈的转换:如进入阻挠博弈;书本相关例子
3.求解子博弈完美(精炼)纳什均衡:如领导者-随从博弈
4.不完全信息博弈的简单应用:如不完全信息下的寡头产量竞争模
型(一个寡头具有两种成本类型)
5.能够运用博弈论方法解决现实问题:如拍卖理论的运用;成本分
配问题。
五、综合题(共10分)
举例说明博弈论在经济金融中的运用。