深度学习算法再次赶超人类，可更快地解出魔方

深度学习算法再次赶超人类，可更快地解出魔方。DeepCubeA是由UCI计算机科学家和数学家编写的一个深度强化学习算法，可以在几分之一秒内找到解决方案，而且不需要任何特定的领域知识或人类指导。众所周知，魔方的最终目标，就是保证每条边、每个面都为同一颜色。考虑到立方体有数十亿条可行路径，这个任务并不简单，更无法通过随机移动解决。

目前研究人员已证明，DeepCubeA解决了100％的测试配置，在60％的时间内找到了通往目标状态的最短路径。该算法还适用于其他组合游戏，如滑动拼图游戏、熄灯（Lights Out）和推箱子（Sokoban），其相关研究已发表在Nature Machine Intelligence。

“人工智能已经能击败全球最好的人类象棋和围棋玩家，虽然对一些难度大的问题，比如魔方，仍没有被计算机解决，但是我们相信人工智能在这方面不会令人类失望。魔方的解决方案涉及更多的象征、数学和抽象思维，因此能够破解这一难题的深度学习机器，正越来越接近成为一个可以思考、推理、计划和制定决策的系统。”，UCI计算机科学教授Baldi说。

研究人员感兴趣的是AI如何以及为何采取这样的行动，以及需要多长时间完善这种方法。研究员先用电脑模拟并打乱这个魔方，一旦代码到位并运行，DeepCubeA将会进行两天的隔离培训，最后解决了一系列难题。Baldi指出，DeepCubeA是自学成才的。此外，一般年轻人解魔方至少也需要50步，但是人工智能只需要20步左右。显而易见，这两种解法所用策略并不同，所以我们猜测AI的推理形式与人类完全不同。

资深计算机科学家Baldi表示，这类项目的终极目标是建立下一代AI系统。其实人们每天都会通过Siri和Alexa等应用程序接触到人工智能，但这并不是真正的人工智能。这项工作是为今后创造出更智能、更健壮、更有推理、理解和规划能力的高级人工智能而迈出的重要一步。