隔着老远就看到你要坐的公交进站,一路狂奔过去,却在最后一秒眼看着它缓缓启动,绝尘而去,下一辆还不知道什么时候能来……还能有比这更倒霉的事情吗?恭喜你!你今天很幸运,这意味着下一辆可能很快就来了!
其实很多时候,赶到公交站时不见车踪迹才是最倒霉的,正好错过上一班车反而是幸运的表现。
公交运行充满了不确定,通常不可能按照计划均匀地到达每一站,堵车、抛锚、或者路况特别好司机开心地在路上飙起了车,都是有可能发生的。公交车的到站时间,经常是一件“非常不可预测的事情”,用统计学的语言来说,就是“随机事件”。在这种情况下,知道上一班车刚走,比起什么都不知道,往往要更好;因为这就意味着,你多掌握了一条信息。你的优势名叫“信息”,信息,正是对付不确定事件的最好武器!
举个例子,某一次考试的卷子发下来,老师要求拿回去给家长签字。但是此时,你并不知道这次考试你排在什么位置、比上次进步还是退步、全班平均分是多少,所以不知道该如何跟家长汇报这个分数,也不确定等着你的是表扬还是臭骂。总之,有点忐忑。
如果这个时候,你知道了“邻居家的学霸小明”只比你高了1分(虽然可能是小明考砸了,但鉴于小明一贯的记录,更可能是这回你考得很好),那么很可能你的父母会非常欣喜,愉快地签了字并且奖励了你一个表扬。
在等公交车这个案例中,“知道我很点儿背地错过了一辆车”就是这样一种信息,而这个信息的出现看似倒霉,其实反而有助于你躲避最坏的场景——准确地说,如果公交车的不确定性足够大的话,那么刚好赶不上一辆车,反而意味着你需要等的时间更少。难以置信吧?这就证明给你看。放心,这个证明只需要最简单的概率知识和绝对不超过加减乘除的运算。
等公交是一个什么样的场景呢?我们来简化一下。
假设我们等的是早班公交车,它每天早上间每隔20分钟发一辆车。按照预期,我所在的站点每天早上6:00到8:00期间,每隔20分钟应该会有一辆车到站,如下图所示。在理想的均匀间隔条件下,我们恰好错过一辆车时,需要20分钟方能等到下一辆车。然而,更大的可能性是,我们并不知道自己到达车站的时刻处于这20分钟间隔的什么位置,用统计学的话说,这是一个随机事件。
所以,我们可能需要等待18分钟,也可能仅需要3分钟,总之,有可能是0到20分钟之间的任何一种情况。平均一下,我们需要等的时间似乎应该是10分钟。
然而,正如前文所述,现实中的公交车到站时间通常是一个随机事件。可能某几辆车的司机恰好是退役赛车手,某辆车的司机恰好早饭喝了过期的牛奶经常要上厕所,还有两个司机倒霉地遇上了堵车。总之,有的车辆比预期到A站早,而有的则很晚。
举个例子,比如这一天我们观察到了如下“到站时刻”分布情况:同时,在实际情况下,我们落在每个间隔里的概率也是不一样的。假设我们在6:00到8:00之间均匀地、随机地挑了一个“到达车站”的时间点,那么我们落在6:00-6:05这个间隔里的概率就是在120分钟里面恰巧赶在前5分钟到达的概率,也就是5/120。同样的,我们落到6:06到7:00之间的这个概率,是54/120。
显然,我们掉到后面这个间隔的概率要大得多。
在每一个间隔区域里,由于我们“到达”这个事件是均匀的、随机的,所以落在每个间隔中的平均等待事件是“间隔/2”。以第一个间隔为例,当我们在6:00到6:05这个间隔中到达车站时,我们的平均等待时间是5除以2,5/2分钟。现在,我们来加权一下,会发现真正的平均等车时间是21.2分钟,超过了均匀情况下20分钟的最长间隔,更是远远超过了理想状况下预期的10分钟!
大脑爆炸了?但仔细想想,背后的道理还是很直观的:由于实际情况下,两车间隔可长可短,而我们掉进长间隔的概率远远大于掉进短区间的。也就是说,你在等的下一个司机恰好喝了过期牛奶拉肚子或者遇上了堵车的概率,远远大于遇上退役赛车手的概率。再概括一点:我们点儿背的概率,其实是大于好运的概率的……
先别哭,我们现在来解释,为什么“公车刚好抛弃了我”这个状况,我们应该开心呢?大家可以注意到,这里面的关键点是“方差”。如果不同的间隔长度都差不多,那么我们的平均等车时间就会更接近10分钟。如果不同的间隔有的特别长,有的特别短,差异性很大,那么我们平均等车的时间就会更久。
如果你连方差也忘了……好吧,这里给你补上:方差描述的是变量的离散程度,也就是它离期望(也就是“算术平均值”)的距离。
方差越大,这些数据的波动就越大。在我们这个例子里,甚至出现了这样的悖论情况:如果我们到达车站的时候,前后都看不见公共汽车,那么我们也不知道自己在哪个间隔的什么位置到达的。我们计算发现,我们的平均等车时间要21.2分钟。但是,如果我们到达车站的时候,恰好看到前一辆公共汽车刚刚开走,那么我们就知道,我们必然是在六个间隔中的某个间隔的起点处,必须等完接下来的全部间隔。
由于一共只有六个间隔,哪个都有可能,所以我们需要等待的平均时间就是(5+5+50+15+40+5)/6=20分钟,居然要更快了!!
又懵了?其实,这是信息的力量,在统计学里,被称作“条件期望值”。在我们这个例子里面,一共有120分钟,其中有一个间隔需要54分钟,还有一个间隔需要45分钟,加起来占用了99分钟,占了将近5/6的可能性。
换句话说,在没有任何信息的情况下,你有将近5/6的几率会掉进这些四五十分钟的间隔里面。但是,如果我们知道了自己在某个间隔的起点,那么六个间隔里面只有两个是四五十分钟的,所以这种概率反而下降到了1/3。
虽然“上一辆公车刚好抛弃我”本身是一个令人悲伤的劣势,但正是因为我们知道了“上一辆车刚走”这个信息,所以,下一辆车的司机是退役赛车手还是喝了过期牛奶拉肚子的可能性都是一样的,这一点点信息让我们反败为胜,反而获取了一点点优势!总结一下:“上一辆车刚走”意味着你需要等完全部的间隔,但是这个间隔是长是短的概率是相同的;而“前后看不见车”说明尽管你落在长间隔里的概率大,但是你未必需要等完整个长间隔。
现实中,两车之间的间隔是个随机变量,如果其方差特别大,那么就很可能出现这种“刚好没赶上车,但其实是更好运”的情况!
在现实生活中,公交车有时恨不得3辆车连着一起来,然后下一辆车……就没有然后了!其方差之大,很可能真的造成“上一辆车刚走,其实更容易等到车”的状况!