国际象棋、《星际争霸》……Nature:⼈类⼜输了。赵熙熙。中国科学报。2023-09-01 19:31:08 编译。赵熙熙与2019年⽆⼈机⽐赛联盟世界冠军Alex Vanover进⾏⽆⼈机⽐赛。图⽚来源:Leonard Bauersfeld。《⾃然》8⽉30⽇发表的⼀篇论⽂报道了⼀个名为Swift的⼈⼯智能(AI)系统,其驾驶⽆⼈机的能⼒可在⼀对⼀冠军赛中战胜⼈类对⼿。
该研究结果标志着移动机器⼈学和机器智能的⼀个⾥程碑,或可启发在其他物理系统中部署基于混合学习的解决⽅案,如⾃动驾驶的地⾯⻋辆、⻜⾏器和机器⼈。深度强化学习系统已在各类博弈中战胜过⼈类,包括雅达利(Atari)游戏、国际象棋、《星际争霸》(StarCraft)和GT赛⻋(Gran Turismo)。不过,这些⽐赛⼤部分是模拟和棋盘游戏环境,⽽不是物理世界的竞赛。
在第⼀⼈称视⻆的⽆⼈机竞速中,职业选⼿需驾驶⾼速⻜⾏器穿过三维赛道。每位⻜⾏员通过机载摄像机的视频直播从⽆⼈机的视⻆观察周围环境。⾃动驾驶⽆⼈机要达到职业⻜⾏员的⽔准很难,因为机器⼈需要在其物理限制下⻜⾏,同时只能根据机载传感器估算其速度和⽅位。瑞⼠苏黎世⼤学的Elia Kaufmann和同事设计了⼀种⾃动驾驶系统,能以⼈类世界冠军的⽔准进⾏物理世界的竞赛。
该系统将模拟的深度强化学习与物理世界采集的数据相结合。在由⼀位职业⽆⼈机竞速⻜⾏员设计的现实世界赛道上进⾏的⼀系列⽐赛中,Swift与3名⼈类冠军对战,其中包括两项国际联赛的世界冠军。⼈类⻜⾏员有⼀周时间在真实赛道上训练,之后每位⻜⾏员在多场⼀对⼀⽐赛中对战Swift。
该系统在多个回合中击败了每⼀位⼈类冠军——25场⽐赛中共获胜15场,⽽且打破了⽐赛的最短⽤时纪录,⽐⼈类⻜⾏员的最快速度还领先半秒。荷兰代尔夫特理⼯⼤学的Guido de Croon在同时发表的⼀篇评论⽂章中写道,该系统应该在⼀个更真实多变的环境中进⼀步开发,从⽽充分释放这项技术的潜⼒。
为了在任何竞赛环境中都能打败⼈类⻜⾏员,该系统必须能应对外部⼲扰,如⻛、光照条件变化、定义不太清晰的各种⻔、其他竞速⽆⼈机和许多其他因素——这都是AI技术需要应对的挑战。