博弈论的应用2013
北京邮电大学 本科选修课程 《信息经济学》 高丛 [email protected] 新浪微博:一花一世界economics
博弈论有助于分析如下问题:
合作问题?! 竞争问题?! 共存问题?! 承诺问题?! 博弈论用理论深入分析 以搞清楚在各种策略互动过程中, 它们是如何发挥作用的。
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
2
最优反应曲线
考虑一个双人博弈,假定你是其中的一
个参与人。 对于另一个参与人的任何选择, 你的最优反应是使你的收益最大化。 如果最大化收益的选择不止一个,
那么,你的最优反应就是所有这些选择
的集合。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 3
一个简单的博弈
列参与人
左
右
1
行参与人 上
0 0 2 1
4
2 0 0
下
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
混合策略
(0,0) (2/3,1/3) (1,1) 两个纯策略均衡 混合策略均衡
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
5
合作博弈
即协调博弈, 在这类博弈中,当参与人能够协调
他们之间的策略时, 他们的收益就会实现最大化。
实际中的问题是要创建一种能够实
现这种协调的机制。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 6
情侣博弈:性别战
女孩
动作片
文艺片
1
男孩 动作片
0 0 2 1
7
2 0 0
文艺片
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
囚徒困境
参与人B
坦白
抵赖
-3
坦白 参与人A
-6 0 -1 -1
8
-3 0 -6
抵赖
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
保证博弈(军备竞赛)
苏联
不生产
生产
4
不生产 美国
3 1 2 2
9
4 1 3
生产
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
斗鸡博弈 (汽车博弈)
列参与人
转向
不转向
0
转向 行参与人
1 -1 -2 -2
10
0 -1 1
不转向
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
管理问题:如何协调
如果你是协调博弈的一个参与人, 那么,你也许愿意与对方在双方都偏爱的均衡处
合作(保证博弈); 或者与对方在其中一方偏爱的均衡处合作(性别 战); 或者采取有别于均衡的策略(囚徒困境); 或者作出某种选择从而实现你所偏爱的结果(斗 鸡博弈)。 除序贯行动以外,声誉和缔结合同是“解决”囚 徒困境的主要方式。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 11
竞争博弈
与合作对应的另一个极端是竞争。 它就是有名的零和博弈。 是因为在
这种博弈中,博弈一方的
收益等于另一方的损失。
实际上,大多数体育竞技项目都是
零和博弈。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 12
足球赛中的罚点球得分
列参与人
扑向左方
扑向右方
-50
行参与人 扑向左方
-80 80 -20 20
13
50 -90 90
扑向右方
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
行参与人的战略: 这两条直线表示的是行参与人的期望收益,它是p的函数,而p则是 行参与人踢向左方的概率。无论行参与人选择怎样的p值,列参与 人将竭力使行参与人的收益最小化。
行参与人 得分的 百分点数 100 90 80 62 50
20
0
2014/10/14
0.7 行参与人踢向左方的概率 北京邮电大学 高丛 新浪微博:一花一世界economics
1 p
14
列参与人的战略: 这两条直线表示的是行参与人的期望收益,它是q的函数,而q则是 列参与人踢向左方的概率。无论列参与人选择怎样的q值,行参与 人将竭力使最大化自己的收益。
行参与人 得分的 百分点数 100 90 80 62 50
20
0
2014/10/14
0.7 行参与人踢向左方的概率 北京邮电大学 高丛 新浪微博:一花一世界economics
1 p
15
最优反应曲线:图中显示的是行参与人的最优反应曲线,它们 分别是p和q的函数,其中,p是行参与人踢向左方的概率, q是列参与人扑向左方的概率。
q 1 列参与人的 最优反应曲线 0.6
行参与人的 最优反应曲线 1 p
16
0
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics
0.7
“与天斗,与地斗,与人斗, 其乐无穷”?!——共存博弈
有关动物互动的一个著名的例子是鹰-
鸽博弈。 它并不是指老鹰和鸽子之间的博弈,
而是指涉及显示两种行为的单一物种的
博弈。 例如,当两只豺狗同时遇到一块食物时, 它们必须决定是争斗还是分享食物。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 17
鹰-鸽博弈
列
鹰派
鸽派
-2
鹰派 行
0 4 2 2
18
-2 4 0
鸽派
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
鹰-鸽博弈的收益 当p>1/2时,鹰派的收益小于鸽派的收益, 反之亦然,这显示了均衡是稳定的。
4 3 2 1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
19
进化稳定策略 (evolutionarily stable strategy)
EES就是一个纳什均衡。 ESS则是用来模型化进化动力下的动物
行为的,这里,具有较高适应收益的策 略的复制速度较快一些。 ESS均衡也是纳什均衡的事实,为博弈 论中的这个特殊概念为何如此引人注目 提供了另一个注解。
2014/10/14 北京邮电大学 高丛 新浪微博:一花
一世界economics 20
同时行动
合作博弈和竞争博弈的例子关
注的都是同时行动的博弈。 事实上, 在合作博弈和竞争博弈中, 如果一方知道一方的选择, 博弈就会变得毫无价值。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 21
序贯博弈
这类博弈的一个重要的策略问
题是承诺。 注意, 对于另一个参与人而言,
这个被承诺的选择必须同时是
不可撤销的和可观察的。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 22
青蛙和蝎子(无承诺) 如果青蛙选择背蝎子过河,蝎子将选择蛰青蛙, 双方最终都会淹死。
青蛙, 蝎子 蝎子选择 背 青蛙选择 不蛰 (5,3) 蛰 (-10,5)
不背 (0,0)
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
23
青蛙和蝎子(有承诺) 依据这些收益,如果青蛙选择背蝎子过河, 蝎子是不会蛰青蛙的,所以双方能够安全地渡过河。
青蛙, 蝎子 蝎子选择 背 青蛙选择 不蛰 (5,3) 蛰 (-10,2)
不背 (0,0)
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
24
善意的绑架 托马斯·谢林(Thomas Schelling)
绑匪, 人质选择 绑匪选择 不揭露 揭露
人质
(-5,5)
(5,3)
(-3,-10)
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
25
当力量成为弱势时
动物世界的心里学。 我们发现, 猪群会迅速地建立起一种支配-从
属关系, 在这种关系下, 支配猪倾向于支配从属猪。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 26
智猪博弈
支配猪
不按控制杆
按控制杆
0
不按控制杆 从属猪 按控制杆
2014/10/14
1 4 3 2
27
0 5 0
北京邮电大学 高丛 新浪微博:一花一世界economics
支配猪也要面临一个承诺问题
如同善意绑匪的例子。 它只须作出不吃掉全部食物的承诺, 它的境况就会得到改善。
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
28
储蓄和社会保障 两代人之间有关储蓄的冲突
年轻人 不善养
赡养
-1
储蓄 老年人 挥霍
1 1 -2 -2
29
3 -1 2
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
时间结构
上述分析忽略了博弈的时间结构: 老年人的优势之一是先采取行动。
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
30
扩展形式的储蓄博弈
老年人, 赡养 年轻人选择 年轻人 (2,-1)
老年人选择
挥霍
(-2,-2) 不善养
储蓄 赡养 (3,-1) 年轻人选择
不善养
(1,1)
2014/10/14
北京邮电大学 高丛 新浪微博:一花一世界economics
31
敲竹杠 承包商为
改颜色索要一个较高的价格,因 为客户除了接受没有其他选择
承包商,客户 让步 客户选择 (1300,0)
承包商选择 找一个 油漆工
(0,-100)
(0,1300)
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 32
厂商如何解决敲竹杠问题呢?
基本的答案是缔结合同。 但是,合同不是唯一的解决方案。 解决这类问题的另一种方式是承诺。 另一个重要的因素是声誉。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 33
博弈论经典问题:讨价还价
经典的讨价还价问题是分配货币。 两个参与人共同拥有1美元, 现在的问题, 他们想分配这1美元, 他们应该怎么做?
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 34
两种解决方案
一种解决方案是纳什讨价还价模型, 最终的结果依赖于参与人厌恶风险的程度, 以及不存在讨价还价时将会发生的情况。 一个替代的方案是鲁宾斯坦讨价还价模型, 它考虑的是一系列选择, 并求解子博弈精炼均衡。
北京邮电大学 高丛 新浪微博:一花一世界economics
2014/10/14
35
最后通谍博弈
鲁宾斯坦讨价还价模型是如此优美,以至于
经济学家们急着在实验室对它作检验。 但是,优美并不意味着准确。 在实际的实验中,美国大学生给出的平均报 价是45美分,并且,在大多数情况下,这个 报价都能够被接受。 一个太少的报价违背了行为的社会准则。 事实上,经济学家已经在最后通谍博弈中发 现了非常重要的跨文化差异。
2014/10/14 北京邮电大学 高丛 新浪微博:一花一世界economics 36