持续了一个月的欧洲杯,终于落下帷幕。北京时间7月12日(周一)凌晨,本届欧洲杯决赛中,意大利对阵英格兰。两队在120分钟时间里1-1战平,意大利在欧洲杯中通过点球大战以3:2击败英格兰夺冠。意大利上次赢得欧洲杯是1968年,2002年与2012年都屈居亚军,今年相隔53年再次夺冠,这也让本届延迟了一年的欧洲杯,成为了近期全球共同热议的话题。
早在比赛前几个月里,就有不少研究机构公布了他们对本次大赛的预测结果,各个AI综合了近年各个球队的数据、比赛结果和球员表现,对欧洲杯的夺冠热门球队、单场比赛结果,都进行了预测。现在看来大部分AI预测结果,几乎都被打脸。数据网站The Analyst对本届欧洲杯各队的夺冠概率进行了AI预测,AI预测结果显示法国队夺冠概率最高,胜率达20.5%,然而最终法国队却止步于八强。
高盛公司的预测就更加成熟稳重了,高盛选择在小组赛结束、四强产生后,对模型进行调整,并结合最终结果进行了复盘。
高盛首先使用自1980年以来6000多场国际足球比赛的大型数据集,对每支球队的进球数进行建模(排除掉了友谊赛),将这些数据量化成四个维度来评估球队夺冠概率:1. 球队实力:世界足球ELO评级;2. 近期势头:近期比赛的进球数和失球数;3. 主场优势:主场多0.4个进球;4. 大赛效应:在大型赛事中的表现优于其他比赛。高盛的研究人员认为比利时将最终夺冠,而四强分别是:西班牙、比利时、意大利和葡萄牙。
足球比赛,为什么难以预测?今年的欧洲杯,似乎大多数预测结果的AI都被打脸了。本届欧洲杯,也出现了荷兰、法国队爆冷提前出局,捷克、英格兰等黑马球队的意外出线,都比赛更加引发关注和热议。除了The Analyst、高盛,不少机构都参与进了近年体育赛事的结果预测中,通常都融合了传统统计、机器学习的方法。
通常这类赛事预测AI,会收集近年内全世界千余支球队的数万场比赛的百亿条数据,并将所有能够影响比赛的因素(如球员伤病情况、转会情况、天气情况等)都数据结构化。再结合博彩公司的盘口和赔率情况,运用机器学习、深度学习等人工智能算法,进行建模,通过分析和匹配得出比赛预测结果。目前人工智能都是依靠可量化的数据进行观察。但如果数据不真实,结果必然是不准确的。
此外,模型无法结合难以量化的因素,例如球队即时状态、球员情绪、现场球迷情绪等等。