AlphaGo的胜利,是深度学习的胜利,是算法的胜利。我们这个世界,正是建立在算法之上。
北京时间2016年3月9日下午15时,经过三个多小时鏖战,九段李世石,向“阿尔法围棋”(AlphaGo)投子认输。这是人类顶尖围棋选手第一次输给计算机。
一直以来,计算机科学都给人一种高深莫测的感觉。很多人因此望而生畏,自动打消了学习计算机知识的热情。
计算机科学,作为自然科学里的新出现的一员,自然会有很多“高端大气上档次”的想法,不写上三五页纸说不清楚;同时,它也有一些你我早已熟识的东西。
电脑有时候就是这么处理问题的。五把钥匙里,有一把是对的,一把一把试过去,总能打开锁。这就是枚举法。听起来有些弱智,但是计算机的运算速度很快,所以至今,仍有用武之处。
这两年,硬盘价格大降,但与此同时,游戏的体积也在不断增加,仍有人嫌硬盘不够用;另一方面,随着3G、4G和移动设备性能的崛起,很多人都爱花钱办个会员,在线或者下载,听无损歌曲。如何才能压缩游戏体积呢?无损音乐又是什么?
这要从数据压缩说起。
在此过程中,你通过统计分析,总结出规律,用更少的字段去描述全部信息,这就是无损压缩。电脑上的无损压缩当然复杂得多,有可能出现“ABABAB……”,也有可能出现“AB10AAB”,但其基本理念是一致的。
“两利相权取其重”,有损压缩因此风靡。
公钥加密是一种很古老的做法——在计算机领域,超过十年就算古董了。
谷歌初创的时候,不过是斯坦福大学的一个学生研究项目。20年来,谷歌深远地影响了世界,世界也见证了谷歌的成长,从学校搬迁到车库,从十万美元的初始投资到一千多亿美元的资产净值,从一个小小的搜索框到涵盖手机通讯在线教育等数个领域的互联网大鳄。
为什么谷歌风靡全球?
因为谷歌的搜索引擎特别好用。
为什么谷歌的搜索引擎那么好用?
因为谷歌的匹配与排名算法极其优秀。
当我们发起搜索请求的时候,比如在谷歌里输入,“川菜的招牌菜是什么”,谷歌的服务器首先要进行匹配,找到我们想要的网页,其次要进行排名,判断不同网页的优先度,也就是计算权重,将我们最想要的,排在最前面。
匹配就像查字典,难的是如何教会计算机查字典。
问题是,这些网页很多,可能有几百万个,怎么对它们进行排序呢?总不能一股脑都摆第一页吧?否则,50寸的显示器也不够用呐。
谷歌的崛起,就是因为排名。
PageRank值本质上是一种等价思想,用一种计算机可以使用的衡量标准,取代人类的衡量标准。“数值高”,就等于人们“最想要”的。如此一来,计算机就能出色地完成我们交付的任务。
有时候,问题并不是这么简单。举个例子吧,计算机该如何进行图像识别呢?更进一步讲,计算机能不能辨识人脸以至于认识到人的喜怒哀乐?
如果谢耳朵花钱请你教他识别面部表情,你该怎么做呢?
你的第一反应,可能是找一台摄像机,把他朋友的喜怒哀乐都记录下来,一个一个地分析给谢耳朵听,让他记住重点,开心的时候,眉毛在哪,嘴唇如何,生气的时候又是怎样,区别在哪里。
思路没有什么大错,只是有两个缺陷:第一,每一个人每一次笑,都有些许不同,还有“激动地流泪”、“长歌当哭”这种场景;第二,就算他学会了,他也只能辨识朋友们的面部表情。
所以,我们改进方案。首先,我们选取最典型的长相,接着,我们寻找最典型的表情,最后,我们为计算机设立一个决策树。
当计算机拿到一张照片的时候,它沿着决策树,将测试数据,和之前的样本数据,进行对比。
最后,计算机给出它的结论,“这是一张男人的照片;他在哭”。由研究人员对结果进行判断,给予奖励或者修正。这样,就计算机就能逐步地建立一个决策体系,准确地识别人的表情。