深度学习的冬天，要来了么？

作为嘉宾，坐在台上的于剑讲述了一个喜忧参半的故事：“我当过某个竞赛的评委，看见过一份说明文档，特别有意思。参赛者说，他只学了一个月的深度学习，用开源工具做了一下就提交了，结果成绩还不错，排在第二。”于剑是北京交通大学计算机科学系的教授，他讲这个故事并不是为了夸奖某个“天才”或者“学霸”，而是为了说明，今天深度学习的门槛已经降得很低。

乍一听，这是个好事，深度学习已经如此容易上手，可另一方面也透露出不那么乐观的信号：大厦已经建成，剩下的只是些修修补补的工作了。

在10月19日的CNCC2019论坛上，包括于剑在内的几位学界和工业界精英对一个命题展开了辨析——深度学习的冬天要来了么？台下的6000多名观众，翘首以盼想从他们的言语中探寻口风——如果冬天真的要来了，可不是一件小事。

在过去的几年，人工智能的学术会议门庭若市，论文的激增让审稿人不堪重负。大量的研究涌向这一领域，有学者说，如果今天提交的人工智能论文不提深度学习都难入围，另外一些人干脆说，今天的人工智能等同于深度学习。今年3月，教育部的通知提到，已经有35所高校的人工智能专业被列入了新增审批本科专业名单；而在2017年，19所高校新增了智能科学与技术专业，2018年这一数字增至96所。

从私募股权投资和风险投资来看，2017至2018年，在人工智能领域，美国、中国的投资都达到了百亿美元以上的规模。

不可否认的是，台下的听众赶上了好时代，他们的腰杆比任何时候都要挺得直——投资者急于知道技术发展的趋势，工程师希望知道深度学习落地的情形，而对于学校的老师和学生，也希望知道，深度学习是否还是一个值得追逐的方向。

今年的3月27日，2018年图灵奖授予了深度学习领域的三位先驱Yoshua Bengio，Geoffrey Hinton以及Yann LeCun，他们多年来的孤独求索和学术成就得到了承认。近些年，在计算机视觉、语音识别、自然语言处理等领域，深度学习也取得了激动人心的突破。然而，一项技术总不是完美的。深度学习也是一样，成绩的背后也不乏批评。

有人抱怨，深度学习训练的模型缺乏解释性，就像黑箱子，你只要接受它给出的结果，哪怕是多么匪夷所思而无需问为什么；也有人挖空心思，专门在图片上改少数几个像素，就可以愚弄模型让它完全认不出人脸。

“从研究的角度看，既然知道深度学习有不鲁棒，不可解释之类的东西，我们就应该更深一步的去思考，怎么样让它更鲁棒和更可解释，而不要把深度学习的开源的软件拿过来就用。”腾讯AI Lab主任张正友告诫道。

事实上，克服这些缺陷不仅是学术界感兴趣的课题，在商业落地方面，在特定的应用场景下，甚至是必需的——在聊天时变个脸或者加个特效，如果匹配不那么完美，也许反而增加了娱乐效果，但如果化个妆就无法刷脸支付还是会平添不少烦恼；如果室内送餐机器人偶尔没识别出碰到人也无伤大雅，但如果换成行驶在繁忙街区的自动驾驶车辆，可能就造成一场无可挽回的伤亡；如果是帮助完全不懂英文的老年人在国外问个路，现在的翻译系统或许可以胜任，但如果用在跨国的商业谈判上，恐怕还是离不开专业的翻译……

实际的场景往往是复杂和意想不到的，这点和论文里描述的相对理想化的情形往往相距甚远。一项在论文里可以工作的技术不见得可以真正落到日常生活中，转化为成熟的产品和服务。在没有检验过之前，没人敢打保票，毕竟光说是不值钱的。深度学习确实也已经有了不少的部署，比如智能客服、拍照购物、智能摄像头、刷脸进站等，但并不都像之前宣讲得那么好。

曾经创造出阿尔法狗的明星公司DeepMind，亏损逐年攀高，2016年1亿5千万，2017年3亿4千万，2018年5亿7千2百万。当然，也有人认为作为探索性的项目，而不是营利性的项目，其亏损有情可原。

早在2011年，IBM就努力要把沃森（Watson）推向医疗市场，自那后IBM宣布了近50项合作，但真正形成商业化产品的寥寥无几；而在推出的产品中，如沃森肿瘤（Watson for Oncology），也被曝出存在问题，遭受了不少质疑。

做了好多年的自动驾驶，目前看，离大规模的部署也还遥遥无期。

众多的初创公司还在艰难的在各个可能“赋能”的行业中摸爬滚打，试图分一杯羹，他们似乎还不足以重新定义或者颠覆某一个行业。深度学习也遭遇了伦理和法律方面的挑战。去年5月，欧盟出台了史上最为严格的隐私保护法，而在另一边的美国加州，今年的9月刚刚通过了一项为期三年的议案，禁止州和地方执法机构在人体摄像头上使用面部识别技术。

不可否认的是，已经有一些研究，在试图解决或者缓解这些困难（比如迁移学习、联邦学习在试图减轻数据稀缺的困境和保护隐私），接下来的疑问是，这些挑战，在多大程度上或者多久能被克服？消费者是否能容忍这些问题的长期存在？

回过头看，这次人工智能的高光时刻当属2016年3月的那个下午，阿尔法狗战胜了围棋高手李世石。之后，不服气的人类派出世界排名第一的柯洁再次对弈，结果一局未赢。

柯洁后来回忆说，内心深感绝望的他曾躲在一个角落独自哭泣。现在看来，他或许用不着那么悲伤——首先，人工智能技术的发展，包括这次的深度学习的崛起，在某些特定任务上，比如下棋和打游戏，人类望尘莫及其实很正常。IBM的深蓝，早在1997年就战胜了国际象棋冠军Garry Kasparov。2011年，IBM的问题回答机器沃森，也打败了Jeopardy游戏的冠军。

不该忘记的是，这些成功仅限于非常有限的情形，比如，如果把围棋棋盘的大小改变一下，就需要把模型重新训练一遍。一个在围棋上能战胜世界冠军的阿尔法狗，却听不懂基本的人话，它只精通某一项任务，而无法像人这样一专多能。另外，现在的人工智能看起来可以做高难度的复杂任务，但与人相比，它对周围的世界依然缺乏理解。如果用一个简化的说法，它依然是一个巨型的分类器，从上千万上亿的数据里去匹配某种模式，以达到识别的目的。

但能认出来不等于理解，它的理解力，似乎都比不过几个月大的婴儿。

“靠现在的计算机体系结构做不了强人工智能。因为现在的计算机的那种计算方式，可能把一个人脸分类做得非常漂亮，也可能把一个语音识别的分类器做得非常漂亮，但我们人的智能有几十种上百种，对不对？现在每一种（机器智能）都是一个网络，网络合到一起就不工作了，你只能把这些网络单独做工作，那我们人不是这样工作。

你要想想有一项类似人这样的一个系统的话，那才行，那是什么？肯定不是现在的计算机。”坐在嘉宾席中央的高文说。他是北京大学的教授，ACM Fellow，中国人工智能界举足轻重的人物。

不过，他也指出，深度学习在面对数据量非常大，收集后想从数据里面找规律的应用，实际上特别适用，而未来的人工智能可能不像现在这么火，但和深度学习没关系，可能是更高层面的、和人的更高的智能关联的研究出现有关。

人工智能芯片的先锋人物、中国科学院计算技术研究所的陈云霁认为，冬天的到来取决于两个因素，第一是会否有更多深度学习的实际应用落地，能够服务人们的生活，“这样的应用越多，冬天的到来可能就越小”；另一方面，要让深度学习从明星技术变成润物细无声的技术，可能前提是有一个更新更被人认可的技术方向，但从目前看，“坦率地说，好像还没有看到一个这样新的技术出现”。

历史上，人工智能也经历过兴衰更替。

人工智能的第一次寒冬出现在1975年左右。一位很有名的英国学者Lighthill称，人工智能是在浪费钱，1973年出版的“人工智能：一般性的考察”的报告称，“迄今该领域没有哪个部分作出的发现产生了像之前承诺的那样的重要影响。”从英国到美国，人工智能的研究经费遭到大幅削减。进入1980年代，随着IBM开始做专家系统，日本推出第五代电脑系统计划，人工智能开始回春。

然而进入90年代又遭遇了第二次寒冬，1987年LISP机器市场的倒塌，第五代计划失败，神经网络并不比其它的方法更好，消耗的资源还多，人们的信心遭到了打击。

事后看，人工智能冬天的到来有各种复杂的原因，技术的发展可能遇到不可克服的困难，变慢甚至停顿；之前过热的炒作吸引了大量的投资导致泡沫；过高的承诺和低于预期的回报招致各方批评，随之预算遭到大幅削减等等。

在高文看来，冬天到来最主要的还不在技术，可能是大量的工作没有了，或者说研究经费砍掉了，“这个可能就是比较明显的一个标志”。前年，在美国的一个会上，高文听到一位计算机视觉领域非常知名的教授公开称，如果他对美国的国家科技基金有决定权，会把所有做深度学习的项目全部砍掉，因为他认为从研究上来说，这件事已经完结了，剩下的应该投到其他的研究方面去。

虽然认为这位教授的说法有一定道理，但高文当时并不那么百分之百同意他的观点。“它不是说一个东西能包打天下，所以从经费角度上来说，冬天会不会来？有可能在有些地方，但中国大概问题不大。”高文说。他进一步介绍，中国自然科学基金把人工智能作为一级学科代码之后，只要申请的量足够，哪怕去申请机器学习，仍然是有机会拿到，所以中国这件事不会发生，在有些地方可能会发生。

高文强调，任何一个科学、技术或者领域，靠一招鲜吃遍天只能是一个阶段，不能是永远。“现在这个阶段，深度学习确实是一招鲜，吃遍天的，但是不会长久。”他说。

如果任何一项技术都是各领风骚几十年，下一项更强大的技术会是什么？

陈云霁认为可能是符号智能，他说：“我觉得大家之所以觉得我们人是具有很强的智能的，其实不仅仅说人可以听、可以看，重要的还有推理、联想，包括一些创作，这些我觉得都跟符号逻辑是有很强烈的这种关系。”从事类脑研究的北京大学教授黄铁军说，“看从有机体到人类是怎么走过来的，我们就知道应该怎么走了。

”接下来的阶段，他希望先实现一只苍蝇的智能，有强大的感知能力，可以灵巧地避障，至于更高级的能力，如因果推理，可能是更远阶段的目标。

从事因果推理研究的清华大学计算机科学与技术系教授朱军认为，也不必等太久，现在就可以进行这方面的研究。依图科技的首席技术官颜水成则说，在未来的3到5年，融合了视觉、听觉、嗅觉等的多模态，软硬一体化会是值得探索的方向。张正友建议把先验知识引入到数据驱动的算法。

“从学术界来说，作为我们个人研究来说，我自己实际上是不准备跟着做深度学习……但是我是并不反对我的学生干，甚至我可以鼓励我的学生去做一做，都没问题。”于剑说。尽管台上的每个人对未来的方向有各自判断，但对深度学习，态度却出奇一致，在他们看来，深度学习是一个工具，它可能不再如此火热，但不会死去。

至于冬天会不会来？也许冬天也并没有想象的那么坏，正如之前神经网络所走过的漫长冬夜，蛰伏过后，一觉醒来就是大放异彩的春天。