昨天这场令所有人心服口服的胜利,让AlphaGo及其背后的DeepMind再次成为国内的焦点。今天,DeepMind的联合创始人哈萨比斯和穆斯塔法在接受采访时,分别向我们讲述了DeepMind研发AlphaGo的目的,以及DeepMind的最终目标。
2010年,DeepMind在伦敦成立。DeepMind的目标是将所有科学家聚在一起去推动人工智能的发展,使其成为人工智能领域的阿波罗计划。我们通过两步走计划来实现这一目标:第一步是了解什么是智能,第二步是利用这些技术去解决通用性的问题。我们希望这种通用型的人工智能技术能成为人类发明的最伟大的技术之一。
具体来说,在管理上,我们建立了一个新的组织方式,其中包括科学实验室的前沿思维和初创公司的特质。在实现的方法上,最核心的概念就是“学习”。我们的所有技术都能自我学习,通过已有的经验,对从未接触过的新问题提出解决方案。要实现这种强人工智能,具体的技术方案包括深度学习和强化学习。
目前的人工智能都比较弱,它们只是利用预设的方式去解决问题。例如,尽管20年前“深蓝”就已经在国际象棋中战胜了世界冠军卡斯帕罗夫,但它只是一套预设的系统——程序员将所有可能的对策输入程序中。这种预设置的方式只能说明程序员的大脑是很有创造性的,但却无法证实电脑的创造性。
过去两年,DeepMind用一个庞大的团队专门用来研究AlphaGo,这个程序的功能就是玩围棋。一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。一方面,它在算法上的难度太大,远远超过简单的启发式算法,同时又包含了庞大的搜索空间;另一方面,它的评估太难,很难计算出黑子还是白子获胜了。
与国际象棋相比,围棋是建设性的游戏,需要盘算未来,国际象棋则是解构性的游戏;围棋中,一个棋子可能会影响全局,它非常深邃非常美,而国际象棋没有这样的特质。而且和国际象棋相比,围棋不是依靠计算而是依靠直觉。直觉可以帮助人获得知识,但是因此获得的经验是没办法言传的,所以只能通过不同的测试来检验他是不是获得了这种直觉,而围棋就是这种测试。
在我看来,AlphaGo目前一定是有创造力的,而且它已经表现出了这种创造力——当然,这种创造力仍然局限于围棋。我们希望可以创造出一个完美的阿尔法狗,因为我们的第一个版本还是有缺陷的。与去年战胜李世石的版本相比,我们在监督式学习的基础上添加了强化式学习,现在我们已经可以熟练使用这两种算法。
与去年相比,由于获得了更好的数据,AlphaGo的运算能力得以大幅提升,其所需的硬件大幅减少,可以在单个tpu上运算。而这些“更好的数据”的来源,正是第一代的AlphaGo。也就是说,AlphaGo自己成为了自己的老师。
当然,对于DeepMind来说,玩游戏显然不是终极目标。AlphaGo就像哈勃太空望远镜一样,它们都是工具,把这种技术应用在能源、医疗、教育和建筑能等方向上,可以帮助我们探讨科学的世界,帮助我们在医学和科学领域取得进步。
穆斯塔法表示,DeepMind目前最成功的应用就是医疗。
去年7月,deepMind与英国国家医疗服务体系(NHS)开展了一项合作,它将与Moorfields眼科医院共同开发一套用于早期识别视觉疾病的机器学习系统,通过对眼球扫描图像的分析,发现糖尿病视网膜病变、老年性黄斑病变的早期症状。穆斯塔法在接受早期采访时称:“糖尿病患者失明的可能性是正常人的25倍。如果我们可以检测并且预警,那么其中98%的视力丧失是可以预防的。”
目前,该项目仍处于研究阶段,但DeepMind却因为所采用的患者医疗信息而遭受质疑。有人指出,DeepMind涉嫌非法使用160万NHS患者的病历,这也让众人对患者信息的隐私性表示了担忧。对此,穆斯塔法承认,在新技术应用的过程中,确实出现了和现有监管机制不匹配的情况。但他也表示:“我们希望医生和病患能更信赖我们的技术。
首先,我们的技术可以节约时间金钱并且能挽救生命;第二,我们的所有操作都接受监管,绝对保证我们的数据不会和谷歌的数据库连接,也不会交给其他的商业公司。”
对于DeepMind选择进入医疗领域的原因,穆斯塔法给出了解释:“我们主要从两点出发选择应用领域:第一,是否有助于提升我们的基础研究能力;其次,是否有助于我们承担我们的社会责任。例如,医疗领域的低效众所周知,而全社会的医疗支出却不断增长,说明很多资金并没有应用在最重要的创新领域。”而对AlphaGo的训练,或许正是DeepMind在实现医学创新道路上的重要一步。