微软面试题 经典测试 (博弈论 经典案例)
相信下面这个问题很多人都见过,博弈论中经典案例--“强盗分金”,测试一下自己的逻辑是否正确
五个海盗抢到了100颗宝石,每一颗都一样大小和价值连城。他们决定这么分:
抽签决定自己的号码(1、2、3、4、5)
首先,由1号提出分配方案,然后大家表决,当且仅当超过半数的人同意时,按照他的方案
进行分配,否则将被扔进大海喂鲨鱼 ,如果1号死后,再由2号提出分配方案,然后剩下的4人进行表决,当且仅当超过半数的人同意时,按照他的方案进行分配,否则将被扔入大海喂鲨鱼 ,依此类推
条件:每个海盗都是很聪明的人,都能很理智地做出判断,从而做出选择。
问题:第一个海盗提出怎样的分配方案才能使自己的收益最大化?
提示:很多人认为第一个人 最危险,其实不然,当然这里是个 理想模型,即所有人都为理性人。
先思考, 参考答案 97 0 1 2 0 或 97 0 1 0 2 详细分析见后文
97 0 1 2 0 或者 97 0 1 0 2 (提示:可用逆推法求出)
做个简单解释...
在此,模型为理想化,即所有人都是理性人,都从自身利益最大化考虑,现在做简单分析:
逆推法
一般人会认为1号最危险,5号最安全,但经过推断,1号利益最大,其余都很小。
5号 策略:否决前面全部,(只有4 5 号)把他们喂鲨鱼,自己独吞。
4号 策略:考虑到 5号的 决定,4号不能 杀 3号,要保存3号 (只有4 5 号的请况,5必投反对票,4 就只能死了)
3号 策略:考虑到 4号的 决定,3号 出 为3,4,5号分别分配(100 0 0)即可,因为4号必支持3号,不然就死了 ,3,4,5投票2:1即可
2号 策略:考虑到3号的 决定,2号 可争取4,5号(98 0 1 1),使4,5利益更大 2,3,4,5投票 形成 3:1
1号 策略 :考虑到2号的 决定,1号 可争取3,4号或 3,5号 (97 0 1 2 0)或(97 0 1 0 2),使他们的利益最大,从而5人投票形成 3:2
注意 前面的人,在争取 他人赞同的时候,前提都是 较 后面的人争取 时,给与他们更多的利益。 下将所有策略对比来看更明显
从下往上对比,你争取某个对象,一定要比后面的某位给他更多的利益(前提:理性人嘛,追求利益最大化)
当然,这是理想模型,仅供参考,看看你的推理是否觉得不可思议~