人工智能(AI)再次战胜了人类冠军。这一次,是在无人机竞速领域。来自苏黎世大学机器人与感知研究组(Robotics and Perception Group)的Elia Kaufmann博士团队及其英特尔团队联合设计了一种自动驾驶系统——Swift,该系统驾驶无人机的能力可在一对一冠军赛中战胜人类对手。这一重磅研究成果,刚刚以封面文章的形式发表在了最新一期的Nature杂志上。
在同期发表在Nature上的新闻与观点文章中,荷兰代尔夫特理工大学的研究院Guido de Croon教授写道,“Kaufmann等人的研究是机器人学家克服现实差距的一个很好的案例。尽管Swift使用AI学习技术和传统工程算法的巧妙组合进行训练,但该系统应该在一个更真实多变的环境中进一步开发,从而充分释放这项技术的潜力。”
尽管如此,研究团队表示,该研究标志着移动机器人学和机器智能的一个里程碑,或可启发在其他物理系统中部署基于混合学习的解决方案,如自动驾驶的地面车辆、飞行器和机器人。当前,基于深度强化学习的人工智能(AI)系统在雅达利(Atari)游戏、国际象棋、《星际争霸》和GT赛车(Gran Turismo)等游戏中已经超越了人类冠军。然而,这些成就全部发生在虚拟环境中,而非真实世界中。
无人机竞速对经验飞行员和AI都具挑战,但AI而言,更具挑战性。因为在虚拟环境中,资源几乎是无限的,而转向现实世界意味着必须使用有限的资源。对于无人机来说,情况尤为如此,因为取代人类飞行员的传感器和计算设备必须被搭载到空中。
Swift系统通过将AI学习技术与传统工程算法融合,实现了智能训练。首先,该系统通过人工神经网络处理无人机从相机中获取的图像,从而精准地检测到门的角落。然后,利用双目视觉软件用来计算无人机的速度。Swift系统的创新之处在于另一个人工神经网络,将无人机的状态映射到调整推力和旋转速率的命令。利用强化学习,通过模拟中的试错过程来优化从环境中获得的奖励。
此次比赛的赛道是由一位外部世界级FPV(第一人称主视角)飞行员设计的。赛道包括七个正方形的门,排列在一个30×30×8米的空间内,组成了一个长达75米的赛道。Swift在与Alex Vanover(2019年无人机竞赛联盟世界冠军)、Thomas Bitmatta(2019年MultiGP冠军)和Marvin Schaepper(3X Swiss冠军)等人的比赛中取得了胜利。
Swift在与每位人类飞行员的大多数比赛中取得了胜利。另外,Swift还创下了最快的比赛时间记录,比人类飞行员A. Vanover的最佳成绩快了半秒钟。从数据分析中可以看出,Swift在整体上比所有人类飞行员都要快,尤其在起飞和紧急转弯等关键部分表现更为出色。
这项研究探索了基于来自物理环境的嘈杂和不完整传感输入的自主无人机竞速,展示了一个人自主物理系统在竞速中取得了冠军级的表现,有时甚至可以超越人类世界冠军,突显了机器人在受欢迎体育项目中达到世界冠军级表现的重要意义,为机器人技术和智能取得了重要里程碑。
然而,与人类飞行员相比,研究中的系统并未经过撞击后的恢复训练。这限制了系统在撞击后继续飞行的能力,而人类飞行员可以在硬件损坏的情况下继续竞赛。另外,与人类飞行员相比,Swift系统对环境变化的适应能力较弱,使用的相机刷新率较低;尽管该方法在自主无人机竞速中表现优异,但其在其他现实系统和环境中的泛化能力尚未充分探究。
显然,Kaufmann及其团队的成就不仅仅局限于无人机竞速领域,这项技术或许可能会在军事应用中找到用武之地。而且,他们的技术可使无人机更平稳、更快速、更长程,有助于机器人在驾驶、清洁、检查等领域更有效地利用有限的资源。但要实现这些目标,研究团队依然需要解决诸多挑战。