深度学习算法再次赶超人类,可更快地解出魔方。DeepCubeA是由UCI计算机科学家和数学家编写的一个深度强化学习算法,可以在几分之一秒内找到解决方案,而且不需要任何特定的领域知识或人类指导。众所周知,魔方的最终目标,就是保证每条边、每个面都为同一颜色。考虑到立方体有数十亿条可行路径,这个任务并不简单,更无法通过随机移动解决。
目前研究人员已证明,DeepCubeA解决了100%的测试配置,在60%的时间内找到了通往目标状态的最短路径。该算法还适用于其他组合游戏,如滑动拼图游戏、熄灯(Lights Out)和推箱子(Sokoban),其相关研究已发表在Nature Machine Intelligence。
“人工智能已经能击败全球最好的人类象棋和围棋玩家,虽然对一些难度大的问题,比如魔方,仍没有被计算机解决,但是我们相信人工智能在这方面不会令人类失望。魔方的解决方案涉及更多的象征、数学和抽象思维,因此能够破解这一难题的深度学习机器,正越来越接近成为一个可以思考、推理、计划和制定决策的系统。”,UCI计算机科学教授Baldi说。
研究人员感兴趣的是AI如何以及为何采取这样的行动,以及需要多长时间完善这种方法。研究员先用电脑模拟并打乱这个魔方,一旦代码到位并运行,DeepCubeA将会进行两天的隔离培训,最后解决了一系列难题。Baldi指出,DeepCubeA是自学成才的。此外,一般年轻人解魔方至少也需要50步,但是人工智能只需要20步左右。显而易见,这两种解法所用策略并不同,所以我们猜测AI的推理形式与人类完全不同。
资深计算机科学家Baldi表示,这类项目的终极目标是建立下一代AI系统。其实人们每天都会通过Siri和Alexa等应用程序接触到人工智能,但这并不是真正的人工智能。这项工作是为今后创造出更智能、更健壮、更有推理、理解和规划能力的高级人工智能而迈出的重要一步。