博弈论基础--生活中的博弈论
《博弈论基础》
结课论文
学生姓名:
学 号:
班 级:
学 院:
论文题目: 生活中的博弈论
2014年4月
1
生活中的博弈论
通过学习博弈论基础这门课,我知道,在现实生活中,上至国家、政党,下至普通百姓,似乎每个人都离不开博弈论。所谓博弈,就是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程。生活中每个人,其每一个行为,如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 博弈的分类根据不同的基准有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:
博弈论中比较典型的均衡是纳什均衡,纳什均衡就是,在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
囚徒困境就是博弈论中含有占优势策略纳什均衡的一个著名例子。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。由于囚徒无法信
2
任对方,因此倾向于互相揭发,而不是同守沉默。下表给出了这个博弈的支付
择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表中的四种行动选择组合中,(抵赖、抵赖)是最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。又比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
博弈中纳什均衡的另一个典型例子是“智猪博弈”。猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零。此博弈的支付矩阵为:
3
这在现实生活中是同样的道理。在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的正是使用谋略最大化自己的利益。 市场进入博弈也是博弈中一个经典案例。即假设一个垄断企业已在市场上(称为“在位者”),另一个企业想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以要阻挠进入者进入。在此博弈中,进入者有两种战略可以选择:进入或是不进入;在位者也有两种战略:默许或是斗争。 在纳什均衡中,参与人在选择自己的战略时,把其他参与人的战略当作时给定的,不考虑自己的选择如何影响对手的策略。进而,由于不考虑自己的选择对别人选择的影响,纳什均衡允许了不可置信威胁的存在。在市场进入博弈中,如果进入者真的进入,在位者的最优战略显然是默许而不是斗争,因为默许带来利润,斗争则无利润。所以斗争是一种不可置信的威胁,也就是说,如果在位企业摆出一副“你进入我就斗争的架势,那么进入企业者不应该被这种威胁吓到,因为它是不可置信的。
其实博弈论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点深奥,但是却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。如上面讲过的囚徒困境的例子,我们可以看到,个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋时,才可以得到最短时间的监禁的结果。因此我们得知,从利己目的出发,结果损人不利己,既不利己也不利他,两个囚徒的命运就是如此。从这个意义上说,合作是有利的“利己策略”。但它必须符合以下黄金定律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。
从博弈论中“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、
4
社会、政治、国防、管理,学习和日常生活中的博弈现象,如价格战、军奋竞赛、环境污染,讨价还价,夫妻吵架等等,数不胜数。我上面说到的例子只是博弈论中非常简单的例子,现代博弈论在纳什均衡定理的推动下已经得到了极大的发展,可见生活中离不开博弈,要想得到更深的理解,还需要我们从生活中不断留意和摸索。此外,了解博弈,分析博弈也会为我们的生活带来更多的方便。
5