国家千人计划专家、上海纽约大学终身教授张峥以“人工智能热”为例,指出中国科研界的怪现象:“零减”——看似与国际发达水平差距为零,但长期依然落后。他认为,这一现象源于我们总是处于跟风状态,而不是超前地对待科学问题。而且这样的问题,在那些有话语权的科学家那里尤其严重。至于创造力旺盛的年轻人在创业环境下,不免视线短浅。张峥此文,值得中国科研界警醒。
在不久前召开的全国科技创新大会上,“力争在重要科技领域实现跨越发展”成为大家关注的话题。这无疑是中国科技事业发展的黄金时期,但是,实现跨越发展首先必须消除科研界的“零减”现象。
所谓的“零减”,是指我们科技发展距离国际最发达水平也许差距为零,甚至只有刀片厚度的距离,但是从长远来看却是在很长一段时期内都会落后。这个站位,不止是目前大热的人工智能领域,在其它很多研究领域,如果不重视“零减”现象,那么在短期内解决这一问题会很难,而且很可能错失发展的黄金时期。
“零减”现象源于总是在跟风。人工智能的井喷状态有一个非常重要的非技术原因:全开放、基本透明的研究方式。
很多成果在第一时间发布在Arxiv.org,公开取用,并附带开源代码,不再苦等漫长的会议评审。含金量高的好算法于是迅速在全世界的实验室遍地开花。同时,“串串烧”也穿透学科壁垒,以深度网络为核心模块的设计理念被绝大多数从业者采纳,某个子领域的创新被“隔壁邻居”拿来复用的例子屡见不鲜。在我的印象里,那么多领域的研究人员合力推进、更新一个技术,是史无前例的。
这两个因素加在一起,对技术前沿推进的提速是指数级别的。所谓水涨船高,国内机器学习的大热和这两个原因息息相关。可以跟、也容易跟的现状,造成了虚假繁荣的假象。纵观当前的重要结果,难觅来自中国科研单位对关键性技术的贡献。
比如,谷歌阿法狗挑战人类棋手前后,国内立刻出现“我狗更可一战”的热闹景象。4:1大胜之后,谷歌DeepMind团队却发出豪言,要让阿法狗不依赖人类对局棋谱,从零开始;坊间笑谈阿法狗没法上麻将桌的话音未落,谷歌的同一队人马发出重文,宣布已经可以在德州扑克上达到纳什均衡的胜负水平……
可以跟、也容易跟,是近乎零差距的原因,掩盖了实力可能正在拉开的真相。跟得越紧也可能越危险,因为关键技术发表之前申请专利的动作是不为人知的,很可能早已“请君入瓮”而不自知。
跟风背后的实力真空让人更为焦虑的是在硬问题面前的实力真空。从宏观上来说,造成这种情况有两个原因。首先,技术成果的飞速更新带来知识更新成本的上升。
这对同时掌握着对国家科研管理部门的进言权和资源分配的管理权,又为繁重的行政和教学任务所累的专家们,是极为严峻的挑战。我对几处中国脑计划的了解是,不同程度上有着无论形散与否都神散的问题。已经过了学习黄金窗口的专家的知识更新滞后是这个现象的主要根源——要同时保持距离和高度是不可能的。
与此同时,国家迫切希望挖掘技术红利的大背景,创业板热钱大量涌入的现状,将绝大多数年富力强、无论在创新还是学习都是黄金阶段的中青年技术骨干裹挟到初创公司。要面对市场就必须针对用户脚踏实地,也必然意味着既不能看太远也不能看太广,甚至不能看太新。一个是跟不动,一个是不能跟。举枪无准星,枪中无子弹。问题是,我们在“零减”的轨道上还要滑行多远?
怎么从跟风到领风在现阶段不跟不现实:大批优秀工作正在涌现之中,不学习就谈不上超越。但要尽量正确地去跟,而不是去盲目刷分。在学习方法的同时更要紧的是琢磨问题是怎么提出的,甚至去想问题背后的母问题是什么。向源头推进,向上游走,要耐得住寂寞和艰苦。
跟的时候要找弯道,但不要幻想存在捷径,幻想短时间内有成熟的果子落地。要清楚地认识到现在的深度网络只是一个阶段性成果,在几年之后一定会遇到瓶颈,把深度网络作为组件放到更大的框架是一个更合理的视野。在跟的时候不时地抬头向远处。
无论让深度学习在图像识别上发力的大数据ImageNet,优秀的训练平台如Caffe和MXNet,关键技术如ResNet,这些站得住脚的重要成果背后都是中国学者的身影。一个合格的带路人和有营养、有耐心的环境是从跟风到领风的关键。