谷歌 DeepMind 团队在最新一期《Nature》上发表论文称,他们研发的人工智能算法击败了欧洲围棋冠军 Fan Hui,同时也击败了目前最好的围棋程序中 99.8% 的对手。而帮助他们解决这个人工智能历史难题的关键是使用了政策网络(policy network)和价值网络(value network)两种深度神经网络。
而就在前一天,Facebook 也在 arXiv.org 上更新了一篇用卷积神经网络和蒙特卡洛树搜索相结合来解决围棋问题的新论文。
在迈向搭建具有更类似人类直觉的人工智能道路上,谷歌取得了出乎意料的辉煌一步;他们研发出能够在极其复杂的围棋游戏中击败专家级人类选手的计算机。他们将论文发表在了《Nature》上。谷歌团队已经表明,掌握围棋所需技能并不为人类独享。他们的一款叫做 Alpha Go 的计算机程序击败了欧洲围棋冠军 Fan Hui,战绩为 5:0。
开发 Alpha Go 的团队是 Google 的 DeepMind,这是 2014 年 Google 在英国收购的一家很小的人工智能公司。这个团队使用的 是一种非常流行和成功的机器学习方法,叫做深度学习,同时还加上了另一种模拟技术来对潜在的步法进行建模。深度学习需要对一个大型的神经网络进行训练,使其对数据中的模式做出反应。事实还证明,它对图像和音频处理也十分有用。
Alpha Go 的关键在于使用的深度神经网络,实际上,在 Alpha Go 中有两种不同的神经网络,第一种叫做政策网络(policy network),用来预测下一步;第二种叫做价值网络(value network),用来预测棋盘上不同的分布会带来什么不同的结果。Alpha Go 使用它们的方法是,把非常复杂的搜索树减少到可操作的规模。
所以,它并不是在每一步都要考虑几百种步数,而只考虑政策网络提供的几十种最有前景的步法,价值网络的作用是减少搜索的深度。
而就在国外媒体对谷歌这篇论文进行大规模报道之前,Facebook 人工智能实验室(以下简称 FAIR)负责人 Yann LeCun 也非常“巧合”地在自己 Facebook 主页贴出了 Facebook 刚刚发表在 arXiv.org 的一篇针对围棋问题的论文,还意味深长的从围棋问题的历史、相关技术、Facebook 研究进展等方面进行了详细说明。
Facebook FAIR 的一位科学家 Yuandong 在几个月前开始独立研究围棋项目,他开发了一款叫做“黑暗森林”的机器人。根据论文中的描述,最新版机器人将卷积神经网络和目前围棋机器人的经典方法——蒙特卡洛树搜索进行了有机结合。
谷歌和 Facebook 正在开展一场破解围棋的算法竞赛。此前,Facebook 一名研究员 Rob Fergue 认为,“围棋就是高级人工智能的目标。” 同时他也承认,Facebook 此举至少在小范围内是在与谷歌进行竞争。谷歌的围棋研究令人印象深刻。