仅剩0.2%的星际2玩家,还没有被AI碾压。这是匿名混入天梯的AlphaStar,交出的最新成绩单。同时,DeepMind也在Nature上完整披露了AlphaStar的当前战力和全套技术:AlphaStar,已经超越了99.8%的人类玩家,在神族、人族和虫族三个种族上都达到了宗师(Grandmaster)级别。
DeepMind在博客里说,发表在Nature上的AlphaStar有四大主要更新:一是约束:现在AI视角和人类一样,动作频率的限制也更严了。二是人族神族虫族都能1v1了,每个种族都是一个自己的神经网络。三是联赛训练完全是自动的,是从监督学习的智能体开始训练的,不是从已经强化学习过的智能体开始的。
四是战网成绩,AlphaStar在三个种族中都达到了宗师水平,用的是和人类选手一样的地图,所有比赛都有回放可看。
AlphaStar学会打星际,还是靠深度神经网络,这个网络从原始游戏界面接收数据(输入),然后输出一系列指令,组成游戏中的某一个动作。AlphaStar会通过概览地图和单位列表观察游戏。采取行动前,智能体会输出要发出的行动类型(例如,建造),将该动作应用于谁,目标是什么,以及何时发出下一个行动。动作会通过限制动作速率的监视层发送到游戏中。
《星际争霸》作为最有挑战的即时战略(RTS)游戏之一,游戏中不仅需要协调短期和长期目标,还要应对意外情况,很早就成为了AI研究的“试金石”。因为其面临的是不完美信息博弈局面,挑战难度巨大,研究人员需要花费大量的时间,去克服其中的问题。DeepMind在Twitter中表示,AlphaStar能够取得当前的成绩,研究人员已经在《星际争霸》系列游戏上工作了15年。