为什么赌球狗总是上天台?

作者: Ent、李子

来源: 果壳网

发布日期: 2018-07-16

本文讨论了足球比赛的不确定性和难以预测性,分析了统计模型在预测比赛结果时的局限性,并探讨了足球运动的魅力所在。

随着法国队捧起了大力神杯,这一届世界杯已经落下帷幕,球评 AI 也为大家献上了如此多的强行科普——但你有没有发现,我们从来都不轻易预测比赛?因为这是 AI 也办不到的事情。谁能想到大热门德国、阿根廷、西班牙早早出局?葡萄牙翻车,巴西也输给了比利时?而克罗地亚作为黑马,通过欧洲区附加赛拿到了世界杯门票,结果一路打到了决赛?

即使,法国队在决赛当中的确技高一筹,赢了克罗地亚,但谁又能想到,他们两队一共进了6个球——上一次进6个球的决赛,还是60年之前……克罗地亚,虽败犹荣!

有个笑话说,不要和统计学家一起去看球:如果弱队爆冷翻盘,你在高呼“进了”的时候,他们只会冷漠地说“测量误差”。倘若真的有如此不近人情的统计学家,那么他大概会觉得足球是一场糟糕透顶的统计学实验。

实验目的是决定到底哪只球队比较强,每场实验至少要持续漫长的90分钟、双方至少各有11位被试,可是最终只能收获两个几乎总是个位数的数据,这些数据又只是由几个短短的瞬间决定,充满了偶然性。太不公平了,这不是测量误差是什么?

事实上,足球确实是主要体育运动里最不可控、最难预测的项目之一,毕竟进球本身很偶然,每场比赛进球数太少,而且平局又那么多。前职业守门员兼统计学家克里斯·安德森(Chris Anderson)曾经做过统计,发现在足球博彩中,被下注者偏爱的足球队只有52%的胜率;相比之下,棒球里这个数据是60%,美式足球和篮球都高达68%。预测足球果然是一件很难的事情。

这届俄罗斯世界杯,高盛就试图搞过预测(勇敢地以“预测不可预测之事”为题),他们设计了一个十分先进的统计模型,考虑了足足53个分别的变量,又做了27个国家一万多人的公众调查。这张榜上,巴西有21%的公众胜率,19%的模型胜率;德国有23%的公众胜率和11%的模型胜率;阿根廷有8%的公众胜率和7%的模型胜率,西班牙有11%的公众胜率和6%的模型胜率,等等……然后结果你们都知道了。

当然高盛的经济学家们也不必羞愧,因为这完全是他们的正常发挥。科罗拉多大学的研究者小罗杰·皮尔克( Roger Pielke Jr.)几年前分析过各家预测,发现包括高盛在内的各种高级统计模型表现都非常差。差到什么地步呢,你把一个队伍里球员身价加起来,比谁更贵,这样的准确率都要更高……

而在2015-16赛季英超莱斯特城夺冠之后,大受打击的球迷和统计学家们又去回顾了一下数据。统计学家甚至对足球的不可预测性进行了定量分析——也就是“强”队到底有多大把握打败“弱”队。结果发现,英超15-16赛季确实是过去13个赛季里最不可预测的,但是,和这13个赛季之间并没有统计显著的差异……

而如果放眼全欧的话,英超确实是主要联赛里最难预测的,但英冠的不确定性还要更胜一筹。最好预测的是西超(划掉)西甲,反正不是皇马巴萨就是马竞(冷漠脸)。不同国家联赛的不可预测性。而且,这种不可预测性还是漫长的联赛,有足足38场比赛(德甲34场)让人累积优势。至于世界杯、欧洲杯这样的杯赛,比赛只有7场(欧洲杯扩军之前6场),不可预测性就更高了,常常都会出现爆冷的情况。

按照克里斯·安德森的估计,足球里技术和运气的比例只能说一半一半。这么看来,这岂不是一种不太公平的运动?也许是吧,但是公平的话,这球可能就不好看了。有平衡性,才更精彩。玩网游的都知道,如果某个职业在一个版本里太强了,下一版肯定就要削弱,不然每次都是这个职业占优势就不好玩了。这在行为经济学里有个名词叫“后果不确定性假说”:越是平衡的运动、无法预测的运动,就越受欢迎,有越多的受众。

NBA经常被拿来和足球比较,这就是一个偶然性相对而言较低的运动:球场小,几乎全员参与攻防,进攻的轮次多,得分高,平局很难。但这样的后果就是,强弱悬殊两队碰面时没什么悬念,比赛的不确定性很低。为了解决这个问题,NBA费了很大功夫来保证各队实力尽可能不要相差太大,最典型的莫过于选秀制度:成绩差的球队挑选出色新人的时候有巨大的优先权优势。

相比之下,足球比赛缺乏制度来保证各个俱乐部的平衡,强队花钱大手大脚,弱队就算有好球员也只能忍痛卖掉。但球队间的差异,一定程度上被赛场上的规则和偶然性拉平了。弱队全场摆大巴,抓住强队失误一个偷鸡就能把强队打懵——还记得这届德国踢韩国的时候吗?……德吹AI不得不再提一次德国队丨图片报。

要减少这种偶然性也不是不可能。传说美国当年要搞足球联赛的时候就想扩大球门,因为觉得进球数太少了(当然最后没有搞)。或者还有很多别的思路,比如放宽越位规则,缩小场地和人数,扩大禁区并判罚更多的点球,取消守门员,诸如此类。这些措施肯定都能增加进球数量,短期内也很可能会让比赛看起来更精彩。但是长期呢?进球数增加、攻防轮次增加,这都会降低足球的偶然性,会让结果更加容易预测,让弱队更难爆冷翻盘。

人们热爱各种体育运动,一定都有各自的理由;而我们之所以喜欢足球,它的偶然性也是非常重要的一部分。三军用命、以弱胜强的励志故事时常会上演;紧张激烈的场面、胶着的比分,亦能让人屏息凝神;而那来之不易的进球,则会让我们的情绪集中爆发,体会到强烈的情感冲击……比赛还没结束,一切都有可能发生。

祝贺法国队,而球评AI 的工作胜利而圆满地完成了。人生就是在这四年一次的等待中轮回,希望下次我们还能相聚在电视机……哦不手机和电脑前。观众朋友们,再见!

UUID: 6d670a5a-3888-44a4-8280-1617407097e0

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2018/2018-07-16_为什么赌球狗总是上天台?谁能想到克罗地亚进决赛,谁能想到比分42?.txt

是否为广告: 否

处理费用: 0.0057 元