AI攻克Dota 2!5v5团战首次击败人类,已超90%人类玩家

作者: 吴非

来源: 环球科学

发布日期: 2018-06-26

OpenAI通过强化学习训练出的OpenAI Five系统,在Dota 2的5v5团战中击败了业余高手,标志着AI在团队协作和策略类游戏中的重大突破。该系统通过大量自我对战进行学习,每天的训练量相当于180年的游戏量,展示了AI在反应速度、操作准确性和团队协作方面的优势。OpenAI计划在The International大赛上挑战顶级职业战队,并认为这项研究的意义不仅限于游戏,还可能应用于城市交通系统、物流系统等现实场景。

当深蓝、AlphaGo先后在国际象棋、围棋界杀遍强手孤独求败时,很多人觉得,人类在决策类游戏中已经无法抵挡AI的挑战了。不过,至少在电子竞技,尤其是多人在线战术竞技游戏(MOBA,例如Dota 2)这种需要团队配合的策略类游戏中,AI尚未攻克人类的堡垒。

6月25日,由埃隆·马斯克和Sam Altman创立的非营利AI研究公司OpenAI宣布,他们在该领域取得重要突破:通过强化学习训练出的OpenAI Five系统,在Dota 2的5v5团战中击败了业余高手。接下来,他们的目标是在今年的Dota 2界最重要赛事——The International大赛上挑战顶级职业战队。

OpenAI公司的首席技术官Greg Brockman将其称作里程碑式的突破:“这项工作在实际应用中意义重大,当你能够模拟某个问题,你就能无障碍地将其应用于更大的场景中。”去年8月,OpenAI就在Dota 2领域一展身手。他们设计的1v1 bot系统在1v1对战中击败了顶级职业高手。当然,相比于团战,1v1对战的实现要简单得多。

作为一款MOBA,Dota 2的难点在于队友间的配合:双方各由五名队员组成,每人操控一位“英雄”,也就是游戏角色。在一张地图上,团队通过分工合作推倒对方的基地,从而赢得胜利。而团队协作,也是AI系统所面临的一项前所未有的挑战。

人工智能之所以难以攻克Dota 2等MOBA类游戏,除了需要系统间的团队协作,还因为这类游戏需要长期的决策——在45分钟的游戏时间内,玩家需要进行上万次操作,而其中一些决策的影响将贯穿全场;相比于棋类游戏的信息透明,每位玩家能够看到的信息,尤其是对方的信息是有限的;在游戏中,系统在一瞬间需要处理2万个数据点,并从1000种不同的操作中作出选择,远远超过棋类比赛中的数量。

面对这一系列难题,在1v1 bot的基础上,OpenAI的研究人员开发出了OpenAI Five算法。研究人员通过强化学习的方法,让AI系统在虚拟环境中,通过不断的自我对战进行学习。它们每天的自我对战量十分惊人,相当于180年的游戏量。也就是说,AI一天的训练量,相当于最具经验的职业玩家一生训练量的数十倍。

训练过程用到了256个GPU和128,000个CPU内核,与去年的1v1 bot系统相比有明显提升。每位英雄使用自己的长短期记忆网络,整个过程没有用到人类的数据。“最初几小时内,AI只会随机地在地图上乱走。但逐渐地,它能够掌握一些基本机能。”Brockman说。

AI系统拥有令人类玩家羡慕的特质。它的反应速度更快,只需80毫秒,比人类玩家快;每分钟可以完成150~170次操作,与人类的顶尖职业玩家相当,并且不会错失点击。AI的优势还体现在,它们能够随时准确获取角色间的距离、装备栏、英雄的健康状况等重要信息,并应用这些数据选择最佳策略。相比之下,人类玩家只能手动检查,或是根据经验及本能进行判断。

从今年5月起,OpenAI Five先后与五支水平不等的业余及半职业队伍进行了5v5团战较量,结果令研究团队感到欣喜:即使在与训练有素的半职业战队的对抗中,AI也在三场比赛中赢得两场胜利。而在与OpenAI员工战队的对战中,AI更是取得了完胜。OpenAI Five的平均天梯分数超过4200分。值得一提的是,OpenAI Five在实战中展现出强大的团队意识。

“为了最终的胜利,它们懂得牺牲一条线路或是一位英雄。”Brockman说道。AI的表现还得到了人类队友的称赞。在一轮测试中,一位人类玩家加入了AI战队。他说,四位AI队友给了他大量支持:“无论我想要什么,这些机器都能实现。”

赢得该系列测试后,研究团队将目标投向了更为强劲的对手。他们计划继续优化系统,并在今年7月28日的The International赛场上,与顶级职业战队进行较量。

虽然OpenAI Five已经在5v5实战中取得不错的成绩,但需要强调的是,目前其适用条件还较为有限。Dota 2玩家都知道,他们需要从115个英雄中选择5个英雄,但目前OpenAI Five还无法做到这一点,它只能用五位选定的英雄【瘟疫法师(Necrophos)、狙击手(Sniper)、冥界亚龙(Viper)、水晶室女(Crystal Maiden)和巫妖(Lich)】进行对战。

不用对AI的英雄选择感到同情,因为人类玩家也被限定使用同样的角色;另外,这次“人机大战”在对战规则上也做了限定:不能插眼、没有肉山、没有隐身能力、不能使用召唤和幻象……如果你对这些名词摸不着头脑,记住,这些多为决策较为困难的操作。

虽然这项研究还有不足之处,在OpenAI团队看来,这项研究的意义远远超出了这款游戏本身。

例如,在现实世界中,AI需要对随时发生的情况作出实时反馈,此类能力正是AI在Dota 2比赛中取胜的关键之一,但在回合制的棋类比赛中无法得到训练。此外,Dota 2需要AI在无法获取完整信息的情况下作出决策,这与大量实际应用场景十分相似。能够掌握Dota 2游戏,意味着AI将可能在城市交通系统、物流系统等现实场景中发挥更大的作用。

UUID: 1f94a553-ccf8-4a61-a55c-fc54d1894967

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2018/2018-06-26_AI攻克Dota2!5v5团战首次击败人类,已超90%人类玩家.txt

是否为广告: 否

处理费用: 0.0049 元