博弈论与策略思维

  • 格式:pdf
  • 大小:1.23 MB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论与策略思维
10
博弈论导论—博弈论和诺贝尔经济学奖
2005:奥曼(Aumann)、谢林(Schelling) 他们通过博弈理论分析增加了世人对合作 与冲突的理解。其理论模型应用在解释社 会中不同性质的冲突、贸易纠纷、价格之 争以及寻求长期合作的模式等经济学和其 他社会科学领域。
博弈论导论—博弈论和诺贝尔经济学奖
11
博弈论与策略思维
博弈论与策略思维
12
2
2012/11/26
博弈论导论
标准式博弈与扩展式博弈 : 矩阵 博弈树 同步博弈与序列博弈 : 每个参与方不知对方决策情况下作出决策; 参 与方先观察对方行动,自己再行动。 一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行,包括 有限重复和无限重复。 零和博弈与非零和博弈 : 一方的情况只有当另一方情况变得更差时才 能变得更好;另外一方情况不必变得更差,一方的情况就能变得更好。 完全信息博弈与不完全信息博弈 : 完全信息博弈是指参与人对其他参 与人的特征、策略和得益函数有准确知识,否则就是不完全信息博弈。 静态博弈与动态博弈:参与人同时选择行动或虽非同时但后行动者并 不知道前行动者采取什么行动;参与人的行动有先后顺序,且后行动 者能够观察到先行动者所选择的行动。
简单发展史 基本分类 博弈论精髓 标准式博弈 均衡分析 应用
同步一次 博弈
重复博弈
博弈论与策略思维
无限重复博弈 有限重复博弈
7
8
博弈论导论—博弈论和诺贝尔经济学奖
1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten) 纳什的基本贡献是证明了非合作博弈 均衡解及其存在性,建立了作为博弈 论基础的“纳什均衡”概念;海萨尼 则把不完全信息纳入到博弈论方法体 系中;泽尔腾的贡献在于将博弈论由 静态向动态的扩展,建立了“子博弈 精练纳什均衡”的概念。 1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey) 这两位经济学家的贡献集中于运用 博弈论对现实经济问题的解释。
2007年诺贝尔经济学奖授予莱昂 尼德 · 赫维奇、埃里克· 马斯金和罗杰· 迈尔 森3名美国经济学家,以表彰他们在创立 和发展“机制设计理论”方面所作的贡献。 瑞典皇家科学院发表声明说,“机制 设计理论”最早由赫维奇提出,马斯金和 迈尔森则进一步发展了这一理论。这一理 论有助于经济学家、各国政府和企业识别 在哪些情况下市场机制有效,哪些情况下 市场机制无效。此外,借助“机制设计理 论”,人们还可以确定最佳和最有效的资 源分配方式。
4
基本框架
博弈论导论 博弈论导论
同步一次博弈 重复博弈:有 限重复博弈与 无限重复博弈 多阶段博弈 不对称信息下 的博弈
基本框架
同步一次博弈
重复博弈:有 限重复博弈与 无限重复博弈
博弈论与策略思维
5
博弈论与策略思维
6
1
2012/11/26
课程主要内容
博 弈 论 与 策 略 思 维
博弈论 导论
博弈论导论—现代博弈论简单发展史
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
结果
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应.
起源可以追溯到1944年数学家冯·诺伊曼与经济学家摩根斯坦合著的《博弈论与 经济行为》,这是20世纪最有影响但读者却最少的书之一 冯·诺伊曼(1903-1957)六岁时以超强记忆力出名,10岁时读完世界史百科全 书,20多岁时已闻名世界数学界,对应用数学情有独钟(著名物理学家维格纳) 父亲是成功银行家(家庭小图书馆),(纺织厂穿孔卡片与巴赫的赋格艺术) 喜欢扑克,研究扑克和其他游戏的数学结构,认识到可以运用到经济、政治、军 事等领域,从而形成了博弈理论 计算机和原子弹是他的业余项目 最早应用博弈论是兰德公司,任务是研究州际核战争的战略,诺伊曼是兰德的常 客 20世纪70年代以来,博弈论在经济学中得到广泛的运用,成为经济学思想史上 与“边际分析”和“凯恩斯革命”并列的重大革命,为人类带来了一种全新的方 法论和思维方式 博弈论与策略思维
博弈论与策略思维
14
博弈论与策略思维
同步一次博弈--标准式博弈
构成标准式博弈的要素有:
参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 参与者 2
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
博弈论与策略思维
纳什均衡
25
博弈论与策略思维
26
同步一次博弈
囚徒困境(塔克)
两个犯罪嫌疑人囚徒A与囚徒B因犯非法持有枪械罪被逮捕。 检察官怀疑他们可能犯有一级谋杀罪,检察官将他们分别关在 两间牢房里进行审讯。检察官对囚徒A说,“我们实行的是 ‘坦白从宽,抗拒从严’的政策;我们已经掌握了你们犯有谋 杀罪的确凿证据。如果你坦白了而他不坦白,那么你将会被无 罪释放,他将会因一级谋杀罪被判死刑;如果他坦白了而你不 坦白,他将会被无罪释放,而你将会因一级谋杀罪被判死刑; 如果你们都坦白,你们都将会被轻判。”当然检察官对B说的 话也是完全一样的。但实际上,两个犯罪嫌疑人都清楚,如果 两个人都坦白,却会因涉及更多的罪案而都被判无期。而两人 都不坦白,只能按非法持有枪械罪被分别判一年。囚徒A与B 的博弈矩阵又是怎样的呢?囚徒A与B将面临怎样的选择呢?
此结果被称为纳什均衡: 在给定其他参与者策略情况下,没有一个参与者 能通过单方面改变自己的策略而使自己的得益提高 ,从而没有人有积极性偏离这种均衡。
23
博弈论与策略思维
博弈论与策略思维
24
4
2012/11/26
Fra Baidu bibliotek
关键点:
寻找占优策略
检查一下你是否存在占优策略,如果有,就选择占优 策略
同步一次博弈的应用(视频)
13
博弈论导论
每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参 与者可以选择不同的行动,但由于相互作用,一个博弈参与者的 得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采 取的行动。博弈论的精髓在于基于这种策略性相互依赖基础上的 理性换位思考,即在选择你的行动时还是考虑你的得益,但是你 应当用他人的得益去推测他人的行动,从而选择最有利于自己的 行动。 博弈论是关于有理性且利益关联的各方在竞争性活动中制定最优 策略的理论,是有关“互动行为”的科学。
27
同步一次博弈
囚徒困境(塔克)
囚徒B
坦白 不坦白
无期,无期 释放,死刑 死刑,释放 一年,一年
囚徒A
策略
坦白 不坦白
个体理性与集体理性的冲突
博弈论与策略思维
博弈论与策略思维
28
专栏1:囚徒困境背后的故事
作为博弈论先驱之一的哈罗德·库恩在1994年诺贝尔奖典礼的专题讨论会 上,讲述了下面的故事 那是1950年春天,塔克在斯坦福大学学术休假,由于办公室紧缺,他住 进了心理学系。有一天,一位心理学家敲开了他的房门,问他正在做什 么。塔克回答:“我正在研究博弈论”,心理学家就问他能否就他的研 究举办一次研讨会。为了那次研讨会,塔克发明了“囚徒困境”作为博 弈论、纳什均衡以及与之伴随而来的非社会意愿均衡的例子。作为一个 真正富有创意的例子,囚徒困境博弈激发了许多学术论文乃至几本巨著。 塔克的才华在于,他发明了这个故事来阐释数学原理。之所以称它为一 种才华,是因为它的展示方法可以形成或者打破一种思想;一种令人难 忘的展示方法能够传播开来,并被大多数思想家更好更快地吸收,而一 种乏味枯燥的展示方法可能会被人忽略、遗忘。(迪克西特、奈尔伯夫)
参与者 2
标准式博弈:均衡分析
则参与者1应该选择 “a”. 参与者1对 参与者2选择“B”的最优反应是 “a”.
5,4 3,3 4,5
参与者 1
a b c
3,2 2,1 1,6
2,3 1,2 1,4
参与者 1
策略
A
B
C
参与者 2
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
2012/11/26
课堂游戏(一) □三个火枪手
博弈论与策略思维
主讲教师:张各兴
乙:80% 甲(30%) 丙(100%)
1
博弈论与策略思维
2
课堂游戏(二) □纸币拍卖
“要想在现代社会做一个有文化的人,你必须 对博弈论有一个大致了解” ——保罗 ·萨缪尔森 鹦鹉的故事
博弈论与策略思维
3
博弈论与策略思维
●同质竞争的零利润定理
博弈论与策略思维
31
公共资源的过度使用和产权界定的重要性(铁 篱笆:欧洲重大的社会进步) 污染排放,渔业捕捞
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 3,3 4,5
博弈论与策略思维
21
博弈论与策略思维
22
站到对手的立场上,想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
基本框架
博弈论导论
同步一次博弈
重复博弈:有限重 复博弈与无限重复 博弈
博弈论与策略思维
15
参与者 1
博弈论与策略思维
16
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “A”
参与者 2
标准式博弈:均衡分析
则参与者1应该选择 “a” 参与者1对参与者2选择 “A”的最优反应是 “a”.
参与者 2
专栏的博弈分析(制药公司销售大战)
默克 辉瑞
策略 适中 庞大 适中 10,10 13,5 庞大 5,13 7, 7
站在对手的位置上思考问题
如果你没有占优策略,那么从你对手角度考虑博弈。 如果对手有占优策略,预期他将按占优策略行动
纳什均衡
我所做的是:给定你所做的,我所做的是最好的; 你所做的是:给定我所做的,你所做的是最好的。
博弈论与策略思维
9
博弈论导论—博弈论和诺贝尔经济学奖
2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz ) 这三位作为不对称信息市场理论的 奠基人被授予诺贝尔经济学奖,以 表彰他们分别在柠檬品市场等不对 称信息理论研究领域做出的基础性 贡献。这些贡献发展了博弈论的方 法体系,拓宽了其经济解释范围。 2002:弗农史密斯(Smith) 贡献主要在于通过实验室实验来测试 根据经济学理论而做出预测的未知或 不确定性。是对以博弈论为基础构建 的理论模型进行实证证伪工作的一大 创举。
博弈论与策略思维
30
5
2012/11/26
囚徒困境的应用--彩电价格大战
同质产品,价格竞争(伯特兰德寡头垄断模型) 海信 长虹
策略 低价 高价 低价 0,0 -1,3 高价 3,-1 1,1 纳什均衡
公共地悲剧
加利福尼亚大学生物学家哈丁:15-16世纪, 苏格兰地区大量草地,由于属公有土地导致过 度放牧,致使草地消失,生态破坏
博弈论与策略思维
19
博弈论与策略思维
20
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… 参与者1对参与者2选择“C”的最优反应是“a”.
参与者 2 参与者 1
策略 a b c A 3,2 2,1 1,6 B 2,3 1,2 1,4 C 5,4 4,5 3,3
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
博弈论与策略思维
29
关键点 囚徒困境是20世纪出现的重要思想之一, 既简单得任何人都可以掌握,又具有极大的 重要性。囚徒困境会发生在生物学、心理学、 社会科学、经济学、法律等诸多领域,只要 有利益冲突的地方,就可能会有困境,它揭 示了个体理性与集体理性的冲突。困境对研 究解释人类社会甚至动物界为什么会有现在 这样的组织与结构极有好处。
2,3 1,2 1,4 5,4 3,3 4,5
参与者 1
a b c
3,2 2,1 1,6
参与者 1
策略
A
B
C
策略 a b c
A 3,2 2,1 1,6
B 2,3 1,2 1,4
C 5,4 3,3 4,5
博弈论与策略思维
17
博弈论与策略思维
18
3
2012/11/26
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.