多年之后,当李世石写起自己的回忆录时,他一定不会忘记那年春天的七个日夜,那或许是他一生中最难过的一周。从赛前的「信心满满」到第一天的「惊讶」;从第二天的「无话可说」再到第三天的绝望。
但最应该让李世石及我们铭记的却是此次挑战赛胜败已定的第四天——李世石在连输AlphaGo 3局后,在第4局凭借自己的绝妙应对和顽强抵抗上演了一场惊天逆转,当几乎所有人都对人类战胜AlphaGo失去信心时,却依靠人类棋手的强大潜能扳回了一局。
比赛一开始李世石就被AlphaGo强势压制,每一步棋考虑的时间都很长,当李世石的常规时间还剩6分钟时,场面处于极大劣势,而此时AlphaGo的常规时间还剩1小时14分钟,甚至古力当时都表示「比赛会在几分钟内分出胜负」。之后风云突变,李世石在78手弈出治孤妙手,局部出棋!致使AlphaGo连出多次昏招。
而已经进入读秒阶段的李世石则好像完全卸下了连输三局的压力,异常冷静沉着的应对棋局,不断积累自己的优势。古力九段表示「如果是自己,现在AlphaGo的获胜机会只有10%了。但目前李世石时间太少,容易使棋手出现失误。」之后,李世石的表现近乎完美,非常稳定的将优势保持到最后,并首次让AlphaGo主动认输,将总比分扳成1:3。
樊麾在接受机器之心专访时所言:「它(AlphaGo)就像一堵墙」在「这堵墙」面前,或许我们不应该再去纠结人类是否能够在围棋(或者棋类游戏)上打败机器。
就像DeepMind AlphaGo项目负责人David Silver在第二局比赛开始前所说,我们想通过与顶级选手的比赛来观察AlphaGo是否有自己的比赛风格,是否能出现一些富有「创造力」的东西,这是我们选择与李世石对战的所有原因,我们需要真正能够推动AlphaGo继续向前进步的人,尝试不同的东西去挑战AlphaGo的极限,让我们可以看到AlphaGo如何应对一些新的情况,我们创造了它,但我们现在也只有静静地站在旁边,像其他人一样看着它的表现。
今天的AlphaGo位我们带来了一种新的表现,不会因为它败给李世石而使人工智能技术受到质疑,就像李世石在前三局输给它之后而使围棋受到质疑一样。这本来就是一次人工智能技术的伟大试验,而纵观人工智能发展的历史,出现了许多这样的测试。所以,在AlphaGo与李世石的对战背后,有一个更深层次的问题值得我们思考:为什么棋类游戏对于人工智能如此重要?
人工智能与棋牌游戏的历史渊远可以追溯到18世纪晚期,奥地利的沃尔夫冈·冯·肯佩伦制造了一个可以下棋的「机器」,在84年的「职业生涯」里,这台机器几乎击败了所有的人类挑战者,甚至包括大名鼎鼎的拿破仑·波拿巴和本杰明·富兰克林。但这终究只是一场骗局,这台机器里藏有一个象棋高手,整个机器也以复杂的构造误导观众,从而能保证藏在机器里的人不被发现。
现代意义上的人工智能与棋类游戏的暧昧情节始于1956年,是的,就是包括约翰·麦卡锡、马文·明斯基等人创造出「人工智能」一词的那一年。Arthur Samuel创造了一种西洋跳棋的应用程序,并使用强化学习来训练这个程序。1962年的时候,Arthur Samuel的这个西洋跳棋程序打败了当时全美最强的业余选手Robert Nealey。
随着西洋跳棋程序的不断进化,上世纪80年代晚期时候,机器已经可以打败顶尖的人类选手。西洋跳棋领域最后一场人机大战发生在1996年,一个名叫「Chinook」的程序完胜人类选手。2007年,Chinook的开发者们在《科学》杂志发明论文称:Chinook已经解决了西洋跳棋领域的所有难题,Chinook可以打败任何一个对手——不论这个对手是机器还是人类。
与西洋跳棋程序同时进化的还有十五子棋(又叫西洋双陆棋,它是一种古老的棋盘游戏,在棋盘或桌子上,靠掷两枚骰子决定走棋的步数,比赛的目的是要使自己的棋子先到达终点。这种棋戏把运气和技术结合在一起,通常两者对取胜都不可缺少。此类棋戏从20世纪后期开始风靡于世。)1979年,Hans Berliner开发的BKG 9.8应用程序以7:1的大比分打败了当时十五子棋的人类冠军Luigi Villa。
尽管Berliner和Villa都认为机器的胜利存在某种侥幸,但当时的电视转播评论员仍然抑制不住震撼「我不希望机器人来到新闻广播行业。」这可谓是又一个机器战胜人类的重要时刻。
接下来就是国际象棋。在Arthur Samuel打造他的西洋跳棋程序之前,克劳德·香农(信息论的开山鼻祖、同时也是「人工智能」一词的提出者)在1950年认为,国际象棋对人工智能研究来说是一项令人兴奋的挑战。但香农的预言显然是错了,在1997年IBM的深蓝打败卡斯帕洛夫之后,人类并没有遇到上述难题的困扰。于是,在几乎所有棋类游戏被机器征服之后,唯一剩下的就是起源于中国的围棋。
所谓可衡量的标准,部分原因就在于我们还无法理解「智能」一词。这也的确是一件颇为讽刺的事情,当人类还不清楚自身的「智能」时,却为了机器智能而奔波忙碌。按照Thurstone的理论,棋类游戏就成为测量人类与机器的一种工具。如果说棋类游戏代表了智慧与智能,那么比赛的结果就能展现出人类与机器在这个领域的强弱。而在国际象棋领域,ELO排名体系是棋手最看重的排名。
当国际象棋最终被机器征服之后,还有哪些衡量标准呢?人工智能研究者也没有放弃对扑克的研究。相对于国际象棋和围棋,扑克没有所谓的完美信息:玩家们无法获取已发生事件的全部信息,诸如对手的底牌。比如虽然德州扑克的缺失信息比西洋跳棋少,但是这种不完美信息的特质计算机挑战德州扑克的难度颇大。
对于任何一个游戏来说,其规则的复杂性往往成为计算机能否快速并最终战胜人类的重要原因。相较于国际象棋和西洋跳棋,围棋的难度要远远这些棋牌游戏,也正是如此,公众(准确地说是东亚三国的公众)如此震撼于Alpha Go对李世石的「碾压」。如前文所言,人工智能研究者使用棋类游戏作为智能的衡量标准,以此推进自身研究的发展。
Alpha Go缔造者、DeepMind创始人Hassabis也强调,他要将Alpha Go延伸到更广泛的领域,由于DeepMind采用通用了的AI技术来研发AlphaGo,理论上其关键算法的确能够较快应用与其他领域。
当Alpha Go一次次让人类代表李世石面露无奈的表情时,作为人类的我们当然需要为李世石的失败感到难过,但同样,但正如樊麾在接受专访时所言,Alpha Go或许发现了一种新的围棋的美,是我们想象不到。
因此从某种意义上说,这不是谁的失败,而是整个人类的胜利,我们通过机器看到人性的光芒,利用机器推动人类智慧的进步,相比于一个五番旗的围棋比赛,在另一个更大的棋盘上,人类与机器还在继续「模仿」与「被模仿」的比赛。