第六章不完全信息静态博弈与动态博弈的基本理论
第六章 不完全信息静态博弈与动态博弈的基本理论
第一节 不完全信息静态博弈的基本理论
一.不完全信息博弈
1.回顾:本课2-4章介绍的均为完全信息博弈。如何区分完全信息与不完全信息?如何区分完美信息与不完美信息?
2.不完全信息博弈又称之为贝叶斯博弈(Bayesian game),在这里,博弈参与人的支付函数不再是博弈的公共知识,至少有一个参与人对另一个参与人的支付函数的了解是不确定的,即该参与人不了解另一个参与人究竟属于何种类型的参与人。例举生活中不完全信息博弈的情形。
不完全信息博弈包括两种类型:不完全信息静态博弈(又称静态贝叶斯博弈,static Bayesian game)与不完全信息动态博弈(又称动态贝叶斯博弈,dynamic Bayesian game)。激励机制设计中大量地涉及不完全信息博弈,通过巧妙的机制设计让私人信息拥有者报告自己的真实信息是机制设计的核心任务之一。
二.不完全信息静态博弈的刻画 1.例子
例一:不完全信息饮酒博弈
一个南方人和一个北方大汉在宴会相遇,这个北方大汉酒量大是众所周知的,而这个南方人是否酒量大,只有南方人自己清楚;北方大汉只知道这个南方人有p的概率酒量大, 1-p的概率酒量小,这一点也是博弈的公共知识。具体情形如下: 图1:南方人酒量大
北方人 喝
不喝
图2:南方人酒量小
南方人 喝 不喝
北方人 喝
不喝 南方人 喝 不喝
问题:(1)南方人是否喝?(2)北方大汉是否喝?
如果北方人喝,期望支付为多少?北方人不喝,期望支付是多少?
例二:不完全信息古诺竞争模型
(1)假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定:
P(Q)aQ,其中Qq1q2,q1、q2分别代表企业1和2提供的产量;企业1的生产
成本为:C1(q1)cq1,这一点是博弈双方的公共知识;企业1对企业2的成本函数是不确定的,即企业2的成本函数是企业2的私人信息,企业1只知道企业2的成本函数有的概率为:C2(q2)chq2,有1-的概率为C2(q2)clq2,其中chcl,这一点也是博弈的公共知识。两家企业同时选择自己的产量以最大化自己的利润。问题:请问两家企业应该如何确定自己的利润最大化产量。
(2)模型分析
A.求解企业2的产量选择
显然,不同成本类型的企业会选择不同的产量水平,即企业的产量选择是与成本挂钩的,于是企业2的产量选择有两种情形:q2(ch)与q2(cl)。 当企业2属于ch类型时,maxq2q2(aq1q2ch) 当企业2属于cl类型时,maxq2q2(aq1q2cl) 由上述两个规划问题的一阶条件,有:
q(ch)=
*2
*
*
aq1ch
2
*
;q(cl)=
*2
aq1cl
2
*
B.求解企业1的产量选择
maxq1(aq1q2(ch))q1+(1-)(aq1q2(cl))q1cq1(思考:为什么这么写?)
*
*
由上式的一阶条件,有: q
*1
(aq2(ch)c)(1)(aq2(cl)c)
2
**
C.联立三个一阶条件生成的方程组,可以得
a2chc1*
q2(ch)(chcl);
3
6
q2(cl)q1
**
a2clc
3
6
a2cch(1)cl
3
(chcl)
(3)将上述结果与完全信息条件下的结果进行比较,ch与cl型企业在哪一种情形生产得更多?为什么?(导致这一局面的根本原因不仅在于企业的产量要受自己成本水平的影响,更
在于双方的信息不对称)
这个例子有意思的地方在于:如果企业2是一家低成本企业,其信息优势地位反而会使自己吃亏。所以,在博弈时并不见得知道得越多、掌握的信息越多就一定越好(生活中还有大量的这种情形,为什么会这样?根源恰好在于信息劣势方追求期望支付最大化)。
(4)不完全信息静态博弈的其他经典案例:密封第一价格拍卖;密封双边拍卖。
(5)来自不完全信息古诺竞争模型的启示 尽管在不完全信息静态博弈中,参与人的行动集与完全信息静态博弈时相同,但是与完全信息静态博弈相比,现在有了两个明显的变化:一是企业2的类型可能是两者之一,从而使得它的支付函数也可能是两者之一;二是企业1必须对企业属于何种类型进行推断。
2. 类型(type)、信念(blief)
(1)类型:博弈论用“类型”表示每个参与人在博弈中可能具有的支付函数情形。以Ti表示i的类型集,记tiTi表示i的一个可能的类型,所以,ti对应着参与人i可能具有的一种支付函数,记ti(t1„ti1,ti1„tn)为其他参与人的类型组合。
思考:写出上述不完全信息古诺竞争中两个参与人的类型集以及支付函数。 由上可知,参与人知道自己的支付函数就等价于他知道自己的类型。
(2)信念: 即概率分布,以pi(ti∣ti)表示i在已知ti的其他条件下对其他参与人的类型
ti的信念,即对其他参与人属于何种类型进行推断。一般来说,参与人之间的类型是相互
独立的,所以,i对ti的信念可以记为pi(ti)(中国的文化大革命期间就曾认为人与人之间的类型不独立,如:老子英雄儿好汉,老子狗熊儿混蛋;中国传统文化也认为“龙生龙,凤生凤”)。 附:Bayes’ rule(贝叶斯法则):即条件概率的计算公示,p(AB)3.不完全信息静态博弈的标准型表示
(1)回顾:如何用标准型表示完全信息静态博弈?G=
S1„Si„Sn;U1„Ui„Un
P(A,B)P(B)
。
其中,Si可能是有限的,也可能是无限的,记siSi为i的一个具体策略;Ui的一般形式为:Ui(s1„s2„sn)。由于在完全信息静态博弈中策略集与行动集是相同的,所以完全信息静态博弈又可以表示为如下:G=
A1„Ai„An;U1„Ui„Un
,其中,Ai为i的
行动集,记aiAi为i的一个具体行动;Ui的一般形式为:Ui(a1„a2„an)。
由上述刻画可以看出完全信息静态博弈的时间路径(或扩展路径)为:首先,所有参与人同时从自己的行动集中选择自己的行动;然后,所有参与人的行动选择共同决定了每个参与人的支付Ui(a1„a2„an)。
(2)不完全信息静态博弈的标准型表示
n人不完全信息静态博弈可以用标准型表示为G=
pi„pn;U1„Ui„Un
A1„Ai„An;T1„Ti„Tn;p1„
,其中,Ai为i的行动集,Ti为i的类型集,pi=pi(ti∣ti)表
示i给定自己的类型为ti的条件下对其他所有参与人的类型的信念,Ui=Ui(a1„ai„
an;ti)表示参与人i的类型是私人信息情形下的支付函数。
思考:为什么这里的标准型表示没有写出参与人的策略集?与第一章讲的标准型表示相比,这里真正的差异在哪里?
注:(1)“类型”这个概念的实际表达作用其实非常大,大到同一个参与人在不同情形下有不同的行动集也可以用类型集来表示,只要略作数学技巧上的处理即可。(2)参与人的支付函数可能也依赖于其他参与人的类型,如果出现这种情况,这意味着什么?
(3)不完全信息静态博弈的扩展型表示与Harsanyi(1967)转换
首先,自然按照某一先验概率分布选择参与人的类型;然后,参与人只能观测到自然对自己类型的选择,而不能观测到自然对其他参与人的类型选择,他只知道其他参与人的类型是以某个概率分布被选择的;再次,参与人同时选择自己的行动;最后,所有参与人的行动选择连同自然的选择共同决定了参与人的支付。
注:这个定义主要是针对每个参与人的类型均是自己的私人信息这种情形的。参与人对其他参与人属于何种类型的推断是利用贝叶斯法则从先验概率分布中推断出来的。
例子:假设企业的产量选择只有两种情形:高产量与低产量,请画出例二(不完全信息古诺竞争模型)的扩展型简图。
从简图可以看出:Harsanyi转换的核心就是将不完全信息静态博弈转换为完全但不完美信息动态博弈(Harsanyi转换中的信息不完美是如何体现出来的?Harsanyi将不完全信息静态博弈转换为完全但不完美信息动态博弈的关键步骤是什么?在这里,完全信息又是如何体现出来的?)。Harsanyi转换使得不完全信息静态博弈变得可以求解。
三.不完全信息静态博弈的求解 1. 策略
(1)回顾什么是策略?
(2)依据对策略的理解,在不完全信息静态博弈中,参与人i的策略被定义为函数
si:tiai,记为si(ti)(思考:这是什么意思?)。所以,集合Ti与Ai之间所有可能的函
数形式被构成了参与人i的策略集Si。
特别注意:一个策略就是一个函数形式,不要以为策略是某函数的一个取值。
思考:写出不完全信息古诺竞争模型中企业1和企业2的策略形式。
(3)分离策略(separating strategy)与混同策略(pooling strategy):前者是指每种不同的类型选择不同的行动;后者是指所有类型或某些类型选择相同的行动。这两个概念在不完全信息动态博弈中更加重要。一旦均衡时参与人选择了分离策略,人们就能够从策略的使用区分参与人的类型。
(4)一个进一步的疑问:我明明已经知道了我的类型,为什么我在制定策略时还要考虑一旦其他类型出现时我将采取的行动?或者说,为什么我还要针对其他明明不会出现的类型规定好自己的行动选择?
之所以需要这样,关键是因为对手们并不知道参与人i究竟属于何种类型,而在博弈时参与人i必须考虑对手们将会如何行动,而对手们将如何行动又取决于这些对手们认为参与人i在每种类型下将如何行动。由此,参与人i即便已经知道了自己的类型,他依然需要考虑在其他情形下如何行动。这一点从不完全信息古诺竞争模型的反应函数中看得非常清楚:企业1的反应函数告诉我们,企业1的产量选择必须考虑企业2在不同类型下的产量选择。而企业1的产量选择又影响企业2的产量选择,于是,企业2即便已经知道自己属于何种类型,他也必须考虑在不同类型下的产量选择,这就意味着企业2的产量选择计划必须考虑所有的可能类型,否则,企业2无法确定自己的最优反应产量。即企业2之所以要考虑自己所有可能的类型,根源在于对手并不清楚企业2属于何种类型以及双方的决策必须考虑对手的反应。
更加重要的是,如果我们允许参与人的策略忽视那些事实上没有出现的情形,我们就根本没有办法把纳什均衡概念运用到不完全信息静态博弈(完全信息动态博弈曾遇到类似的问题)。 也有人认为,应该是企业1针对企业2的不同类型来选择产量作为自己的反应,而不是企业2针对自己的不同类型选择产量。这个例子告诉我们这个看法似是而非——企业1的产量选择是单一的,而只有企业2的产量选择是一组产量。
2.贝叶斯纳什均衡——不完全信息静态博弈的解
*
(1)贝叶斯纳什均衡:在不完全信息静态博弈中,s1*„si„sn构成一个(纯策略)贝
*
叶斯纳什均衡,如果每个参与人i以及i的每一个类型,均有: maxai
u(s
i
ti
*
1*
(t1)„si*1(ti1),ai,si*1(ti1)„sn;ti)pi(ti∣ti)。
上述优化问题只是给出了类型为ti时参与人i的最佳行动选择,这意味着参与人i有多少种类型,就得求解多少个优化问题。
(2)关于均衡的上述定义意味着在均衡状态之下,没有人愿意单方面改变自己的策略选择,即每个参与人的策略都必须是其他参与人的策略选择的最优反应(回顾:如何证明一个策略组合是否构成纳什均衡?),这一基本思想在各种博弈中是始终一致的。
四.不完全信息静态博弈与完全信息静态博弈中的混合策略纳什均衡 1.案例:不完全信息夫妻博弈(源自Gibbons一书153-154页)
假设对对方的了解均没有达到完全知己知彼的程度,具体说来:如果夫妻均选择看足球,则丈夫获得的支付是2+a,a的大小只有丈夫自己知道,妻子只知道a是从区间为[0,x]均匀分布中独立抽取的;如果夫妻均选择看芭蕾,则妻子获得的支付是2+b,b的大小只有妻子自己知道,丈夫只知道b也是从区间为[0,x]均匀分布中独立抽取的。当然x是很小的(这意味着什么?)
妻
夫 足球
芭蕾 (1)用标准型表示该不对称信息博弈。
夫妻的行动集是相同的,均为{足球、芭蕾};夫妻的类型集也相同,均为[0,x];夫妻的信
(b)(a)=念p夫
=p妻
1x
;双方的支付则参见上图。
(2)现构造一个纯策略贝叶斯纳什均衡:如果aa
*,则丈夫选择看足球,否则就去看芭蕾;如果bb,妻子就选择看芭蕾,否则就去看足球。 通过计算发现:当且仅当a
xb
*
*
-3a,丈夫看足球;当且仅当
b
*
xa
*
3b,妻子选择
*
看芭蕾。因为这是一个对称的博弈,故ab
**
32
,从而丈夫看足球、妻子看
芭蕾的概率为1
32x
。
若x0,则1
2x
23
(思考:这意味着什么?)
(3)上一步的工作表明:完全信息静态博弈中的混合策略纳什均衡可以视为不完全信息静态博弈中纯策略贝叶斯均衡的极限,即混合策略纳什均衡的合理性不是在于参与人真的随机
选择策略,而是在于参与人不清楚对手会选择哪个纯策略,而这又是由于对手拥有微小的信息优势。
第二节 不完全信息动态博弈的基本理论
一.不完全信息动态博弈
1.不完全信息动态博弈的若干例子
例子1:用人单位不清楚求职者的能力状况;求职者为了显示自己的能力状况,向用人单位发出显示信号(如文凭、资格证),用人单位根据接收到的信号判断求职者的能力状况并决定是否录用。买方不清楚产品的质量;卖方为了显示产品的质量状况,向买方发出显示信号(如各种质量认证标识、免费维修承诺),买方根据接收到的信号判断产品的质量状况并决定是否购买。
例子2:保险公司不清楚投保人的风险倾向;保险公司设计出一系列保险合同菜单供投保人选择,不同类型的投保人选择最适合自己的保险合同。政府规制部门不清楚垄断企业的成本水平;规制部门设计出一系列规制合同供垄断企业选择,垄断企业选择最适合自己的规制合同。
上述例子的共同之处:存在信息不对称。存在信息的交流与沟通,前者是信息优势方主动行动,被称之为“发信号”(signalling);后者是信息劣势方主动行动,被称之为“甄别”(screening)。
2.信念、序贯理性(sequential ration)、合理信念(reasonnable belief)——四个重要的要求 (1) 要求1:在每个信息集,该行动参与人必定对自己已经到达信息集中的哪个节点拥有自己的信念(或猜测)。
在非单点信息集,信念就是信息集中所有节点上的一个概率分布;如果是单点信息集,信念就是到达该节点的概率为1。 这个概念的引入使得“子博弈”的概念被一个更加宽泛的概念所取代:连续博弈(continuation game),它能够始于任何信息集,而不管它是否是单点的。
(2)要求2:给定参与人的信念,参与人的策略必须是序贯理性(sequential rational)的,即给定其他参与人的后续策略(subsequent stategy)以及参与人在该信息集的信念,相关参与人在每个信息集上的行动选择必须是最优的(optimal)。 所谓后续策略是指给定的信息集到达以后针对博弈以后可能出现的每一种情形所制定的完整的行动计划。
(3)均衡路径(on the equilibrium path)信息集与非均衡路径(off the equilibrium path)信息集 给定一个扩展型博弈的均衡(这里的均衡并不一定就是指纳什均衡),所谓信息集处于均衡路径是指在该均衡下该信息集有正的概率被到达;所谓信息集处于非均衡路径是指在该均衡下该信息集肯定不会到达。
(4)合理信念:
要求3:给定参与人的均衡策略,均衡路径上信息集的信念根据贝叶斯法则形成。
要求4:给定参与人在此有可能(where possible)的均衡策略,非均衡路径上信息集的信念根据贝叶斯法则形成。
所谓贝叶斯法则是指条件概率p(A∣B)的计算公式,令p(A),p(B),p(A,B)表示先验概
p(A,B)p(B)
率(prior probability),则p(A∣B)=。
3.不完全信息动态博弈的解——完美贝叶斯纳什均衡(perfect Bayesian N.E) (1)完美贝叶斯纳什均衡是指由满足上述要求1-4的策略与信念所构成的均衡。(关键是两个:决策的序贯理性与理性的信念)
(2)不同博弈类型及其解
完全信息静态博弈——纳什均衡;完全信息动态博弈——子博弈完美纳什均衡
不完全信息静态博弈——贝叶斯纳什均衡;不完全信息动态博弈——完美贝叶斯纳什均衡
(3)对完美贝叶斯纳什均衡的进一步理解
A与其他均衡相比,完美贝叶斯纳什均衡最关键的特色就是在定义均衡时将信念抬到了与策略同样重要的地位,即均衡不再是单纯由每个参与人的策略所构成,而且还包括每个参与人在他的每个信息集的信念。
在定义贝叶斯纳什均衡时,不同的研究者使用的定义会有差异,有的只包括要求1-3,有的也许包括不止四个要求。
Kreps和Wilson等使用的序贯均衡(sequential equilibrium)就是一个比完美贝叶斯纳什均衡更强的解。
B使用要求1-4,意味着我们假定参与人总是持有合理的信念,并且总是依据合理信念选择最优的行动,从而帮助我们剔除不合理的均衡。
C 纳什均衡、贝叶斯纳什均衡以及子博弈完美纳什均衡具有一个共同的缺点,即不能剔除在任何非均衡路径信息集上玩严格劣策略的威胁,这个弊端只有完美贝叶斯均衡能够避免。
(4)例子
例子1:A参与人1首先在L,M,R之间进行选择,如果参与人1选择了R,博弈结束,则参与人1获得支付1,参与人2获得支付3;如果参与人在L,M之间进行选择,参与人2只能观察到参与人1的选择是否是R,然后参与人2在L,R之间进行选择;如果结局是(L,L),则各得支付(2,1);如果结局是(L,R),则各得(0,0);如果结局是(M,L),各得(0,2);如果结局是(M,R),各得(0,1)。
思考:用展开型与标准型分别表示上述博弈;上述博弈有几个子博弈以及纳什均衡?上述博
弈的子博弈完美纳什均衡是什么?
从上面的博弈可以看出,(R,R)这个纳什均衡虽然依赖于一个明显不可信的威胁(因为L明显优于R),但是无法被子博弈方法精炼掉。
运用上述四个要求对1中的例子进行精炼
上述四个条件实际上是说理性的参与人会对自己处于哪个节点进行合理的猜测,然后根据自己的猜测作出合理的行动选择。
依据上述条件,假设处于L节点的概率为p,处于M节点的概率为1p,则简单的计算会表明理性的参与人2不会选择R。其实,这里根本无需用到第三个与第四个要求。
例子2:参与人1首先在A和D之间进行选择,如果1选择A,则博弈结束,三人各得(2,0,0);如果1选择D,则由参与人继续在L和R之间进行选择,然后由参与人3在L和R之间进行选择。参与人3无法观测到参与人2的选择。如果结局是(D,L,L),则各得(1,2,1);如果结局是(D,L,R),则各得(3,3,3);如果结局是(D,R,L),则各得(0,1,2);如果结局是(D,R,R),则各得(0,1,1)。
问题:该博弈有几个子博弈?请找出该博弈所有的纳什均衡?该博弈的子博弈完美纳什均衡是什么?(D,L,R);p1(其中p表示参与人2选择L的概率)能否通过完美贝叶斯纳什均衡的检验?
(A,L,L);p0中的策略组合也是纳什均衡,上述策略与信念也能够通过完美贝叶斯均
衡中要求1-3的检验,因为参与人3有信念而且依据信念选择最优行动;给定3的后续策略,参与人1和2也选择各自的最优行动。但是,(A,L,L)不是子博弈完美的,问题出在参与人3的信念p0与参与人2的策略选择L不一致。如果博弈按照给定的策略组合进行,则参与人3的信息集处于非均衡路径,要求1-3对其是不管用的。如果引入要求4,就可以发现这个均衡及信念的不合理之处。
(5)完美贝叶斯纳什均衡与其他均衡概念的关系
A均衡概念之所以变得越来越复杂,是为了在更复杂的博弈中剔除不合理(implausible)的均衡。
B完美贝叶斯纳什均衡是为了对贝叶斯纳什均衡及子博弈完美纳什均衡进行精炼,以剔除动态情形下不合理的贝叶斯纳什均衡以及子博弈完美纳什均衡。
(6)完美贝叶斯纳什均衡的两种重要类型 A分离均衡(separating equilibrium):在均衡状态下不同类型的参与人选择不同的行动
或策略。
B混同均衡(pooling equilibrium):在均衡状态下不同类型的参与人选择相同的行动或策略。
注:其实还存在准分离均衡。