数据不能以我们期望的方式说服他人——在现实世界中,这种情况相当普遍。任何在节假日聚餐时与亲朋好友“争论”过的人都可能注意到了,通常情况下你给出的相反数据越多,他们似乎就越相信自己的先验信念。为了充分理解贝叶斯推理,我们需要从数学上理解为什么会出现这样的情况。这将有助于我们在统计分析中识别和避免这些情况。
假设一个朋友告诉你,他能以90%的准确率预测掷6面骰子的结果,因为他有超能力。你很难相信这个说法,所以用贝叶斯因子进行假设检验。和“神秘预言家”的例子一样,你需要比较两个假设:第一个假设代表你相信骰子是均匀的,且这位朋友没有超能力。如果骰子是均匀的,我们有1/6的机会猜对结果。第二个假设代表了朋友的信念,即他真的可以在90%的时间里正确预测掷骰子的结果,因此给出的概率值为9/10。
接下来我们需要一些数据来验证他的说法。假设朋友掷骰子10次,正确猜出结果9次。所得的似然比表明,朋友有超能力这个假设解释数据的能力是他只是很幸运的这个假设的468517倍。根据贝叶斯因子评估准则,这意味着我们应该十分确定是真的,即朋友拥有超能力。
那些仅凭似然就给出奇怪结果的情况中,结合先验胜率大多就可以解决问题。显然,我们相信朋友假设的程度远不如相信自己假设的程度,所以用强大的先验胜率来支持你的假设是有意义的。一开始就可以把先验胜率设置得足够小,这样就可以抵消贝叶斯因子的作用,然后看看能否解决问题。
假设朋友继续掷骰子5次,并成功预测出5次的结果。现在我们就有了一个新的数据,它代表掷骰子15次,朋友猜对了其中14次的结果。现在计算后验胜率,我们会发现,即使先验胜率很小也于事无补。
这里的问题是,我们不愿意相信朋友有超能力。如果在现实生活中发现这种情况,你很可能会很快得出其他的结论。例如,你可能认为朋友使用的是作弊用的灌铅骰子,在90%的情况下会掷出某个数值。这是第三种假设,而前面的贝叶斯因子只关注了两种可能的假设:骰子是均匀的,以及朋友有超能力。
重要的是要明白,假设检验只能比较一个事件的两种解释,但很多时候其实有无数种可能的解释。如果获胜的假设不能说服你,你任何时候都可以考虑第三种假设。
如果在节假日晚餐时分与亲戚讨论过政治、气候变化或者最喜欢什么电影之类的话题,那么任何人都会有这样的亲身经历:他们在比较的两个假设都能很好地解释数据(对争论的人来说),但只有一开始的先验保留了下来。如果再多的数据都改变不了任何事情,那么怎么改变别人或者自己的信念呢?
在贝叶斯推理中,信念至少是可以被证伪的,这一点至关重要。在传统科学中,可证伪意味着某些东西可以被证明是错误的,但在这个案例中,它只表示必须有某种方法来削弱我们对一个假设的信念。
因此,下次与亲戚就政治或阴谋论辩论时,你应该先问他们:“什么数据会改变你的想法?”如果他们没有答案,你最好不要试图用更多的数据佐证自己的观点,因为这样做只会让他们更加坚定自己的信念。