11月28日,对于热衷在王者峡谷里组队开黑的《王者荣耀》玩家来说,是个让人又爱又恨的日子,因为那个难度变态的“绝悟挑战”回来了,增加到了二十关,每一关的敌方阵容都不一样,难度也在呈几何级数上升。你在游戏中要面对的,不是狡猾的最强王者小学生,而是“绝悟”——由腾讯 AI Lab 与王者荣耀联合研发的策略协作型 AI。
“绝悟挑战”对于许多《王者荣耀》玩家来说,是一种“分分钟被教做人”的体验。更恐怖的是,腾讯官方宣布,“绝悟”刚刚升级为“绝悟完全体”,创新算法突破了可用英雄限制,让 AI 完全掌握所有英雄的所有技能,能掌握高达10^15种英雄组合数变化!
今年5月,“绝悟”在《王者荣耀》游戏内,与高水平真人玩家对抗了642,047局,胜率高达97.7%,这已经不是碾压,更像是一场屠杀,和它交手过的玩家都在怀疑人生:“是我太菜?还是我之前玩的是假王者?”
从理论上讲,让AI学会玩“王者”和教它下围棋,在底层理论上别无二致,都是一种探索-发现机制:让AI探索外部环境、得到反馈、然后根据反馈调整策略进行输出、力争完成预定目标。不过,像《王者荣耀》这种5对5的即时MOBA类游戏,其策略多样性和游戏环境的不确定性,比围棋复杂太多。
“绝悟”背后的算法是强化学习技术,它源自心理学中的行为主义理论,目标是让AI实现“拟人化学习”。首先,研究人员把游戏中的一切元素,都抽象为各种集合(特征),让AI进行记忆。其中,我方英雄,敌方英雄,包括拥有运动和速度属性的单位,称为向量特征,地形元素和水晶塔等静止单位称为图像特征,再让AI了解这些要素之间的“相生相克”。
更可怕的是,“绝悟完全体”能够掌握10^15种英雄组合,使得真人玩家基本无法靠阵容组合实现克制。这是如何做到的呢?
腾讯AI Lab表示,为了应对多英雄组合问题,技术团队引入了“老师分身”模型,就好比《射雕英雄传》里江南七怪教郭靖:首先,分别训练单个AI使用某一英雄阵容,直到精通,例如代号00001的AI,只负责熟悉安琪拉、妲己、王昭君领衔的“草丛三姐妹”,代号00002的AI专练阿轲、兰陵王领衔的“隐身组”……最后,再引入一个AI,作为学生,模仿先前学习所有的AI老师。
这样,“绝悟”就掌握了所有英雄全部组合的各项技能。
不过,早期的“绝悟”在“经验”上并不丰富,所以有时会因为“套路明显”而落入真人玩家的陷阱。一些玩家在与“绝悟”交手后,迅速总结出了一些AI游戏操作的规律,诸如“有龙必开,从不蹲草”等等,从而使得真人玩家在早期的“绝悟挑战”中,能够料敌机先,增加自己击败AI的可能性。
为何要开发“绝悟”?当然不是单纯为了碾压玩家,打击大家“开黑”的信心。腾讯AI Lab表示,像《王者荣耀》这样的复杂游戏,是训练AI分析决策的绝好平台,从而让我们距离攻克 AI 终极难题——通用人工智能(AGI)更近一步。乐观一点想,虽然人类可能在游戏世界里被AI轻松秒成渣,但换来的却是AI能够在各个方面,以完美的方式完成其他复杂困难的任务,这样一来,占便宜的依旧是我们,狡猾的人类。