人工智能(AI)的很多潜在应用,涉及与人类交互时做出更优化的实时决策,而竞技或者博弈类游戏,便是最佳的展示舞台。今天,发表在《自然》杂志上的封面文章报告称,AI在赛车对战游戏Gran Turismo(GT赛车)中战胜了世界冠军级人类玩家。这个AI程序名为“Gran Turismo(GT)Sophy”,是一种神经网络驱动程序,它在遵守赛车规则的同时,展现出了超凡的行驶速度、操控能力和驾驶策略。
完成这项AI程序研发的核心团队来自索尼AI事业部(Sony AI),《GT赛车》系列游戏是日本Polyphony Digital公司开发,忠实再现了真实赛车的非线性控制挑战,封装了复杂的多智能体交互,该游戏在索尼PlayStation及PSP等游戏主机平台上皆有发行,是一款极具拟真感操纵体验的热门赛车游戏。
研究人员认为,此项成果或让赛车游戏变得更有意思,并能提供用来训练职业赛车手和发现新赛车技巧的高水平比赛。这种方法还有望应用在真实世界的系统中,比如机器人、无人机和自动驾驶汽车等。
赛车比赛的目标很简单:如果你比竞争对手在更短的时间内跑完赛道,你就赢了。然而,实现这一目标需要极其复杂的物理战,驰骋赛道需要小心使用轮胎和道路之间的摩擦力,而这种摩擦力是有限的。为了赢得比赛,车手必须选择让汽车保持在不断变化的摩擦极限内的轨迹上。
近年来,深度强化学习(DRL)已成为Atari、星际争霸和Dota等领域AI研究里程碑的关键组成部分。为了让AI对机器人技术和自动化产生影响,研究人员必须证明能够成功控制复杂的物理系统,此外,AI技术的许多潜在应用要求在接近人类的情况下相互作用,同时尊重不精确的人类规范,汽车比赛正是充满这些挑战的典型领域。
在GT Sophy的开发过程中,研究人员探索了各种使用机器学习来避免建模复杂性的方法,包括使用监督学习来建模车辆动力学,以及使用模仿学习、进化方法或强化学习来学习驾驶策略。为了取得成功,赛车手必须在四个方面具备高度技能:(1)赛车控制,(2)赛车战术,(3)赛车礼仪和(4)赛车策略。
为了评估GT Sophy,研究人员在两项赛事中让GT Sophy与顶级GT车手进行了较量,GT Sophy在所测试的三条赛道上都取得了超人的计时表现,它能够执行几种类型的转弯,有效地利用漂移,扰乱后面车辆,拦截对手并执行其他紧急操纵。
关于电子竞技、博弈类的游戏,AI能战胜人类早已经不是什么稀奇事,而且可以肯定的是,AI还会越来越强,即便是人类顶尖选手也只能甘拜下风,但能赢电子比赛并没有太多悬念和意义,关键还是看这些超越人类的AI程序如何切实攻克产业瓶颈,真实造福人类生活。
来自斯坦福大学机械工程系教授J.Christian Gerdes认为,GT Sophy研究所带来的影响也许能远远超出电子游戏范畴,随着许多公司致力于完善运送货物或乘客的全自动车辆,关于软件中有多少应该使用神经网络,以及有多少应该仅基于物理,值得进一步去探索。总的来说,在感知和识别周围环境中的物体时,神经网络是无可争议的冠军。
然而,轨迹规划仍然是物理和优化领域,GT Sophy在游戏赛道上的成功表明,神经网络有一天可能会在自动化车辆的软件中发挥比今天更大的作用。