李世石又输了,果不其然!“不负众望”地输掉了跟alphago的第二局比赛。如果说第一局李世石是在试探阿法狗的棋风,那么第二局从开局开始,李世石就显得异常稳健。而且,这盘棋并没有像很多人预料和说的那样呈现出一边倒的情形。其实,直到中盘时,双方都还显得那么地势均力敌。
更令人难以置信地是,执黑的阿法狗竟然也出现了几手大昏招,从而让李世石赶紧抓住难得的罅隙,到对局室外面悠闲地抽起烟来。但是,其中有一次抽烟的时候,阿法狗竟然下出了五路冲那样令人瞠目结舌的让曹大元九段要报警的一手棋!
此后的李世石便几乎是一蹶不振,频频读秒,摇头,手抖,叹气,出汗,满脸通红,这种计算机从来不会变现出来的各种生理特征和表现,让人们一下子看出了似乎李世石状况不妙。果然,不就,一代大师就此投子认负!
本来李世石还打算跟对手复盘,但刚抬起的手又慢慢放下了:他蓦然想起,对方是一台机器,根本就没有任何心理,更没有任何复盘的必要,它也不会将它当时的想法告诉任何人。阿法狗所做的只是悄悄地默默地将这盘棋存到自己那广袤到足以令世人倒吸凉气的棋谱库中,然后,快速进行自学习,将其掰开揉碎,跟自己已经学会的所有技艺进行比较、关联、挖掘、分析、评判,直至完全消化。
这种学习方式足以让任何一位人类棋手胆寒,不只是因为能力强大、速度快,还因为这个对手没有任何感情和生理表露,没有任何偏好和心理活动,它的所有想法只有一个——也是其制造者赋予给它的唯一任务——在所有后续盘中选择最终效能和局势最好的下法。
所以,就算阿法狗跟李世石复盘——其实我们也能想象得到——阿法狗的唯一解释就是:我之所以这一步这样走完全是因为在当前的*****种走法中,这一步的最终结局和效能是最好的,你要看完全的解释吗?请看,然后就在屏幕上进行路演,然并卵的是,每一步的路演可能要耗时三五天。假如你是一位9段棋手,当你听到这样的解释,你能怎样?除了佩服其强大的计算能力?就像欧阳修的卖油翁一样,无它,手熟尔!
当然,阿法狗并不是天生就这样的,就在去年它刚刚战胜樊麾时,还被几乎所有的亚洲棋手斥为业余级水平。但几个月之后,就完成了脱胎换骨的蜕变,到底发生了什么?据阿法狗的研制人员说,对樊麾的比赛中,他们使用了3000万个位置作为原始数据,来训练AlphaGo的价值网络;在对李世石的位置中,他们可以使用1亿个位置训练;另外,也投入了更大的运算量。
同时,想起1997年IBM深蓝击败世界象棋冠军卡斯帕罗夫,两者还是有很大不同的。据说,阿尔法狗并不是列举穷尽所有的可能,而是通过“经验”推理出最优解。AlphaGo首先习得了人类围棋大师3000万步的走法,之后自我博弈3000万局积累胜负经验,从而构成策略网络,给出落子选择;同时,在自我博弈的训练中形成全局观,构成评价网络,给出修正落子选择。
如此循环往复的学习进阶,让AlphaGo可以与李世石分庭抗礼。
但,其实,让我说,我认为,套用一句时髦词,你要是认真你就输了!因为,从一开始,从人们开始用比赛之类的项目来测试以评判机器的AI水平的时候,特别是以1997年深蓝战胜卡斯帕洛夫为标志,这时人类始终被摆在一个不公平竞争的位置上。
毕竟人,作为统治这个星球的高级生物,毕竟是有血压、心跳的动物,围棋作为一项高智商的运动,通常耗时持久,是对人生理、心理等多方面的考验。在这个项目上,人竟然要跟机器竞争?!人类为什么不跟汽车比100米赛跑?
面对人的时候,你还可以通过对手的面部表情、呼吸、习惯性动作来进行综合判断,哪怕对方给你布了一个陷阱。可是,面对机器呢?别说没有面部表情,他们连面部都没有,当你面对这样的冷血动物,你能做的确实不多,所以,李世石能做到这样,已经令人肃然起敬。
当然,不管如何,棋还是会下下去,而且一定会下满5盘,也就是说不论好戏还是烂戏,一定会唱完。无论总比分,无论多少人在赛后歌颂AI歌颂谷歌,无论多少人同时将AI视为洪水猛兽,都无法改变一个趋势:人工智能只能越来越多地参与并影响我们的生活。对于我们来说,则一方面要深入理解alphaGo的决策机制,一方面做好准备,迎接并享受人工智能。
当然,可以肯定的一件事是:谷歌是这个big thing中的最大赢家,全世界的瞩目再一次让google这几个字母风靡全球,就像当年(1997年深蓝击败卡斯帕洛夫时),IBM因为一系列的营销而节省了大约1亿美元的广告费用。请大家注意一个事实:IBM公司1989年就成立了“深蓝”工作小组。无论怎样,生活还会继续,并且一定会更美好!拭目以待后面的比赛!