用逻辑颠覆你的直觉!这个著名的海盗分金币问题,你会解么?

作者: 张通

来源: 新东方智慧学堂

发布日期: 2021-09-28 12:28:55

这个著名的海盗分金币问题是一个博弈问题,涉及5个海盗如何分配100枚金币,通过递推和逆向归纳法分析不同数量的海盗情况下的最优分配策略。海盗的性格特点和理性假设影响最终分配结果。

你会解这个著名的海盗分金币问题么?

这个著名的海盗分金币问题,常出现于博弈相关的书籍中。有5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,投票要超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,由下一位再次提出方案,依此类推。请问:1号最多能给自己分配并得到多少金币?

这个问题是博弈问题,有一个重要假设:海盗是完全理性的且完全理性是公共知识。这道题的答案,将完全超乎你的想象。海盗的收益很好量化。首先要活着,则死亡的收益为-∞;在保全性命的情况下,自己获得金币数即为收益。海盗的性格特点会影响到结论,所以这里先不定义。

问题直接思考并不容易,原因是五个人各怀鬼胎,又互相影响,没法同时分析。常用套路为减少变量简化问题,从简单入手发现规律(一般是递推规律),即逆向归纳法。所以,我们先从最后只剩2个海盗的情况分析,然后逐渐增加,最后递推出,1号海盗最多可以给自己分配多少金币并成功拿到。

两个海盗的情况:首先看只有两个海盗时的情况。

当只有4号5号两个海盗时,注意到题目中是“超过半数”,仅有1个海盗同意的话,正好是50%,没有超过半数。所以4号和5号必须都同意,4号才能活着。如果4号当分配给自己超过0枚金币时,5号必不同意(这样方案被拒,4号喂鲨鱼,剩下的所有金币会落到5号的身上,5号的收益从原来的不到100变为100,收益增加)。于是4号只能分配给自己0枚金币,此时自己的收益为0或-∞。

这里我们发现会有两种可能,原因是5号拿到100枚金币前,可以选择同意方案或者拒绝方案,从收益来看,对他没有区别,所以接下来要分类讨论了,用海盗的性格特点来决定分类:

类1,在相同收益情况下,海盗心狠手辣,尽可能地使其他海盗收益更低;类2,在相同收益情况下,海盗念及旧情,尽可能地使其他海盗收益更高;类3,在相同收益情况下,海盗看心情随机选择。类1下双方收益为(-∞,100);类2下双方收益为(0,100)。结论:当只剩两个海盗时,4号海盗什么都拿不到,为了活命只能把所有金币给5号海盗。

三个海盗的情况:当有3号4号5号三个海盗时,情况会发生一些变化。

如果是类1的情况下,根据我们上面的结论,此时4号已经知道,如果最后只剩两个海盗时,自己必死,所以当只有3个海盗时,4号肯定会无条件同意3号的选择,于是1号的分配结果为(100,0,0)。这样的话,就是3号4号同意、5号反对的局面,分配成功。

如果是类2的情况下,此时4号已经知道了当只有两个海盗时,自己收益为0,所以当只有3个海盗且3号的分配结果为(100,0,0)时,4号必同意(否则自己收益不变,3号收益变为-∞,不符合念及旧情)。关键来了,如果是类3的情况下,3号的分配结果还是(100,0,0)吗?考虑一种可能:4号心狠手辣,5号念及旧情,当1号分配方案为(100,0,0),4、5号均拒绝。

注意到死亡的收益是-∞,即是说即使有万分之一的可能,3号也不会铤而走险,而是求稳,于是3号的分配结果是(99,1,0)。结论:当只剩三个海盗时,3号海盗最少能拿99个金币。

四个海盗的情况:当有2、3、4、5号四个海盗时,2号知道想要方案通过,要超过半数人同意,即有3人同意才行。这三个人中,自己肯定同意,但3号除非给99或以上才可能同意,舍弃,这样下来,4、5号的同意票一定要拿下。

在类1的情况下,想要4、5号同意,2号必须给4、5号比三个海盗的局面下更多的金币,即(98,0,1,1)。在类2的情况下,2号的分配结果为(100,0,0,0)时,4、5号念及旧情仍会同意。类3的情况是最难分析的。2号需要考虑在最坏的情况下,4、5号也必须支持自己,则分配结果为(97,0,2,1)。

否则,若分配方案为(98,0,1,1)时,4号心狠手辣,不同意四人方案,让2号喂鱼,接着同意三人方案,自己收益均为1没变,但2号收益降低,这是他喜闻乐见的结果;若分配方案为(98,0,2,0)时,5号心狠手辣,不同意四人方案,让2号喂鱼,接着心情变化为念及旧情,同意三人方案,自己收益均为0没变,变的只有自己的心情。结论:当剩四个海盗时,2号海盗最少能拿97个金币。

五个海盗的情况:递推规律已经慢慢显现出来,当有1、2、3、4、5号五个海盗时,同理,1号海盗知道自己同意,2号舍弃,则3、4、5号海盗中,他必须争取到2票。在类1的情况下,由于3号在上面原本1枚都没有,现在给1枚就可以支持自己,然后再给4,5号其中任意一个2枚即可,分配结果为(97,0,1,2,0)或者(97,0,1,0,2)。

在类2的情况下,1号的分配结果为(100,0,0,0,0)时,3、4、5号念及旧情仍会同意。在类3的情况下,同理分析,得分配结果为(97,0,1,0,2)(唯一结果)。结论:1号海盗最终可以拿到97枚金币,且超过半数人同意。

到这里原问题就被解决了。总结一下:1、海盗的性格特点是会影响到结论的,心狠手辣、念及旧情、心情不定会导致不同的结果。2、在递推过程中,是从后往前推理,这是逆向思维,是一种常见的分析方法。3、涉及完全理性是公共知识的问题,换位思考是十分必要的。4、考虑所有情况,特别是最坏的情况。

那,六个海盗呢?如果问题改成6人分金币,也容易按此思维方式推理下去。

不过要注意的是,在类1的情况下,五人问题是双解,所以在考虑六人问题时,要考虑所有情况,即1号的分配结果为(95,0,1,2,2,0)或者(95,0,1,2,0,2)。最后两个海盗如果给1枚是不行的,因为五人问题时,他俩都有一定概率被赋予2枚,所以可能会拒绝六人时的方案,而对于1号来说,方案拒绝意味着收益为-∞,万分之一的可能都要规避。

另一方面,最后两个海盗如果给2枚是可行的,因为确定2枚的收益显然大于有概率2枚或0枚。在类2下,容易得到,1号的分配结果为(100,0,0,0,0,0)时,3、4、5、6号均会同意。在类3下,1号的分配结果为(96,0,1,2,1,0)。到这里,会发现一个奇怪的现象,所有海盗心狠手辣,比所有海盗心情不定,1号竟然能分配到更多的金币。

原因也很简单,在五人问题时,类1多解,类3唯一解,1号为了规避不确定性所以要让出更多的利益。

关于此问题还有诸多变式,比如把题目中的“超过半数”改为“不少于半数”,这又是一个新的问题了。100和5也可以换成其他数。利益与性格特点也可以耦合,比如常见修改是“海盗在损失不超过1枚金币的情况下,更乐见同伴死亡”,等等。不过只要善用递推及上述的推理原理,不难解决。

UUID: c6b91401-2c3a-4a06-aae1-46df84a856d3

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2021/中科院物理所_2021-09-28_你会解这个著名的海盗分金币问题么?.txt

是否为广告: 否

处理费用: 0.0077 元