能自动避开障碍物的无人驾驶汽车,在无聊时陪主人“神聊”的智能手机语音助手,比亲朋好友还“懂”我们的推荐算法……不知道你是否已经注意到,人工智能技术早已渗透进生活的方方面面,正以前所未有的速度接近下一次技术革命,而开启下一次技术革命大门的钥匙就藏身于人工智能技术的广阔蓝海中。
面对自动运行的家用电器或与智能音箱对谈的时候,也许你会对它们的贴心、智能化感到不可思议,机器为何能读懂人类的想法呢?其实,目前的人工智能基本都是基于机器学习技术实现的,可以说,是“机器学习”让家里的电器读懂了你。
机器学习,顾名思义,就是让机器具有学习的能力,而学习能力正是普通机器与人工智能的分水岭。18世纪中叶,在瓦特改良蒸汽机的时代,开启了人类第一次工业革命的蒸汽机只会夜以继日地重复一个动作,任何看过这台机器的人都不会把它与“智能”二字联系起来。随着科技的进步,人们设计了许多更为复杂的机器,但它们仍然不具备基本的智能。20世纪50年代,计算机理论迅速发展,机器学习终于登上了历史的舞台。
有了数据之后,研究者还需要选择合适的“学习方法”才能让机器学得更快、更好。你也许听说过一些与机器学习有关的名词,比如监督学习、强化学习等,实际上这些都是描述机器学习过程中不同的训练方法,往往适用于不同的情况。
例如,研究者希望让一个算法学会辨认猫和狗,如果提前给算法输入大量猫和狗的照片,并且告诉它这张照片是猫还是狗,那么这就是监督学习(Supervised Learning);如果研究者给算法大量猫和狗的照片,但是不告诉它哪些是猫,哪些是狗,而让算法自动寻找猫和狗的差异,这就是非监督学习(Unsupervised Learning);如果让算法不断地做选择题,每次都让算法“看图”后选择是猫还是狗,答对奖励加分,答错惩罚扣分,算法在试图尽量得分且规避扣分的情况下,经过大量训练便会“进化”出辨认猫狗的能力,这就是强化学习(Reinforcement Learning)。
虽然机器学习让人们身边的很多物品越来越智能化,但距离真正的“强人工智能”还有很大的差距,这是因为当前基于数据的AI算法在很多时候有很大的局限性。比如,一个长期接受“辨识猫狗”训练的AI算法可能会把吉娃娃错认为猫,也有可能把无毛猫误认为狗,这主要是因为机器学习得到的结果与训练数据高度相关。
如果训练AI用的数据是偏颇的,比如训练用的猫的照片基本都是有毛的长尾猫,狗的照片基本都是大型犬,那么这样训练得到的AI算法就很容易在辨识某些其他种类的猫狗时犯错。
贝叶斯网络的创始人、图灵奖得主朱迪亚·珀尔认为,让人工智能实现本质飞跃的关键就藏在每一个人的大脑中,即上天赐予人类的强大武器——因果逻辑。
珀尔把思维分成三个等级:第一个等级是关联,与之对应的是观察的能力,这是目前基于数据的“弱人工智能”所处的级别;第二个等级是干预,与之对应的是控制变量实施行动的能力,即能够借助干预来获得认知;第三个等级是反事实,与之对应的是想象的能力。幸运的是,人类的大脑处在第三等级,想象力给予我们通过想象构建反事实——虚构世界的能力,从而建构认知。
现在,生活中常见的人工智能系统与“强人工智能”还有很大差距,它们还不具备判断因果关系的能力,也完全没有第三等级的想象力。不过,科学家已经认识到“因果学习”是让人工智能实现下一次飞跃的关键,许多科学家相继投入到“因果机”的理论研究中。
例如,清华大学的崔鹏教授提出了通过将因果推理与机器学习相结合的稳定学习(Stable Learning)来改进OOD泛化问题;卡内基梅隆大学的黄碧薇博士利用因果关系发现框架,在时间序列的非稳态数据上实现了更精准的预测。随着技术的发展,人工智能技术一定会越来越可靠,并能最终造福人类。