汤继良:从小镇走出来的KDD科研新星
8月15日,ACM SIGKDD国际会议(简称KDD)颁布了若干奖项,来自密歇根州立大学数据科学与工程实验室(Data Science and Engineering Laboratory)的汤继良教授荣获新设立的第一届KDD年度新星奖(Rising Star Award)。
该奖项的设立旨在表彰KDD社区里在博士毕业五年内便获得卓越科研成就的年轻学者,汤教授获得该荣誉的原因在于他在特征学习(尤其是图和图在网络、社交媒体和智能教育上的应用)领域所取得的杰出成就。
汤老师的学术成果卓著,在影响因子期刊与多个顶级学术会议发表过上百篇研究成果。他的研究贡献具有开创性,探索了数据挖掘领域的新思想或新方向,因此被其他研究人员广泛引用。
他论文引用量突破12000次,h-index 52, 超过30篇论文的单篇引用量超过100,并屡获学科领域大奖,其中包括美国自然科学基金杰出青年奖(NSF Career Award),KDD最佳博士论文奖亚军和顶会如KDD与WSDM上获得7次最佳论文奖(包括提名)。
汤老师的研究课题主要围绕两方面:一是算法研究,二是如何应用算法解决业界实际问题,比如与京东合作优化购物网站的推荐系统,与好未来合作如何将AI应用于教学设计。在私下的来往中,我们发现汤老师是一位性格随和、低调谦虚又满怀感恩的人,自称“智商一般”,但却有着勤奋与踏实的行事风格。
尽管北京理工大学是全国名列前茅的优秀院校,但对当年的汤老师来说,他与母校和计算机专业结缘,源于“高考失利”。
在2008年本科毕业之际发表于北京理工大学期刊上的文章《大学的符号》里,汤老师曾记载自己在大一上学期的颓废与迷茫。颓废了一个学期之后,汤老师决定重拾高中时代的学习热情。大一第二个学期便开始刻苦学习专业课程,并开始阅读大量计算机专业知识,大一刚开始接触C语言便挑战最难的大作业——编写俄罗斯方块。
等到上了大三,汤老师的代码量已经突破10万行,他开始接触自然语言处理,并在老师的委任下负责项目里的核心代码开发。尽管英语能力一般,但汤老师大三期间坚持阅读了10本以上的计算机英文专著。由于一直保持着优异的学习成绩,他被免试保送至本系继续攻读计算机软件硕士。本科期间,汤老师曾沉迷《史记》,总结出一个人生哲理:“高尚的人有高尚的灵魂,成功的人总走一条坚持不懈的路。”
研究生毕业后,汤老师便去了美国亚利桑那州立大学攻读计算机博士,并有幸师从著名的数据挖掘专家刘欢教授。说起申请博士的面试经验,汤老师回忆,他在出国之前的英语能力就相当于“菜鸡”,连面试官(一位印度师兄)的英文提问都听不懂。但是,机智的汤老师提前准备了一些面试问题并写好了答案,虽然听不懂面试官的问题,但面试官一停顿,他就想应该是问完问题了,然后对照念自己的答案,没想到居然顺利通过了。
回忆读博的历程,汤老师感慨:“那是一段痛苦又快乐的经历。”几乎每天工作10多小时,一周7天,天天如此。他用PHD三个字母总结自己的读博生涯:Push(不断逼迫自己)、High aim(不仅是求顺利毕业,还要有更高的目标,比如成为该领域的专家)、Dedicate(要聚焦于某个方向,克服芝麻与西瓜两手抓的心理)。直到读博,汤老师才发表了第一篇国际顶会论文,由导师刘欢老师指导。
汤老师形容自己“智商一般、基础比较差”,比如在美国考驾照考了3年19次才通过考试,在北京学习生活了6年普通话也没有变好。
汤老师自认为是一个能力在平均水平的人,但他觉得,这并不是坏事,“作为平均人有一个好处就是,我们的心态特别好,我们不需要时时刻刻保持做到最好,只需要做到比过去的自己更好就很高兴;同时我们还不怕失败特别能够坚持不懈,就像我考驾照,失败了18次,那就再考第19次。
”“我能有今日成绩,主要是在对的时间,遇到对的人(导师和小伙伴),并入对了行(研究方向)。同时也归功于自己的清晰的认识到自己一般的基础和水平;让我做事情更加有耐性和毅力。”2017年,汤老师所发表的论文在Google Scholar上的引用次数为2000+,直到今天,仅仅三年,引用次数已达到12000+。
最近,“小镇做题家”的概念在豆瓣与知乎上很流行,指的是来自农村地区的贫寒学子依靠题海战术与高压学业训练考进一流高校,但在读大学期间乃至毕业后变得泯然众人,甚至面临“毕业即失业”的风险。从小地方来到大城市,无论对初出茅庐的青年学生还是工作打拼的社会人,对大城市里俨然不同的人情世故感到陌生与不适应,是很正常的。
有人会因为自卑而消沉、一蹶不振,也有的人能够及时调整好自己的心态,把握见识的机会,不断提升自己,寻找更广阔的天地。
“我是小地方出来的。”时隔16年,汤老师回忆起高考后刚到北京时的心情,有不适应但期待更多,这与他处理高考不如意的结果时采取的态度是相似的。如果按“小镇做题家”们对自己处境的自嘲式提法,可以说汤老师与“小镇做题家”们有着一个类似的起点。
但不同的是,汤老师并没有像他们一样依然沉迷于中学时期形成的做题世界,而是在新环境中经历了短暂的失落和迷茫之后能正视自己的“平庸”,并勇于走出自己的舒适区域,用实际行动去撕掉曾经困扰自己的一个个标签,走出了与“小镇做题家”们不一样的道路。
谈及高考失败对自己的改变,汤老师认为,“负面影响只是短暂的,正面影响才是长久的。
”虽然我们永远也不可能知道高考成功后的人生是否更精彩,但我们可以看到,汤老师在今日所取得的成就是可人的。“高考之后,我真正学会思考了。”汤老师谈到,在上大学之前,他可能只是擅长做题与考试。直到高考“落榜”,他第一次体会到:原来人生是有挫折的,人生是会失败的。原先在小地方总考第一名,便理所当然地对自己有很高的定位,后来才发现在这个世界上“山外有山,人外有人”。
至于高考失利的压力,与后来的人生难题、大学学习和科研过程相比,更是无足轻重。
他还提到,以前自己的脾气特别差,“但上了大学之后,脾气变得特别好。”感觉人成长了不少。对自己有了一个更全面的了解后,汤老师总结,在资质一般的情况下,自己只能努力追赶、付出更多的时间,才有可能取得更高的成就。也正是因为汤老师对自我的觉悟,即使如今要一边照顾刚出生的小女儿、一边带领学生做实验与研究,他始终对自己的科研工作保持着极高的热情。
值得一提的是,高考结果的不如意也让汤老师收获了美满的幸福。汤老师与太太是高中同学,太太的考试成绩不如汤老师,但由于汤老师的高考分数比平日考试的分数低了,因此与太太在同一年进了北理工,继续成为校友,后来又同年去美国留学。在本科时汤老师一度打算毕业后离开北京去其他城市打拼,当时的准女友、后来的太太的态度成为了汤老师留下来的最重要因素;而在之后艰难的科研生涯里,太太的支持一直是汤老师的后盾。
乐观迎接挑战,使汤老师不仅能克服短暂的高考阴影,也不断突破自己的视野。“我去北京,最大的收获就是增长了自己的见识。”虽然一开始对大城市的生活很懵懂,但他的心态很好。遇到优秀的人与事,他不会看低自己,而是会思考:“我能不能变得跟他们一样强?或者是,有哪些方面我可以向他们学习?”他很乐观,就像高考前一个月压力大到每天晚上都失眠、差点都以为自己抑郁了,但高考结束当天,马上睡了一个好觉。
“去到大城市,让我们看到更大的世界和更强的人,让我们萌生更加多的想法和梦想。”大城市更注重素质教育,小地方的学生更多时候只会做做题,但汤老师认为会做题也是一种优势,因为大学学习也需要做题。
汤老师曾经在雅虎和IBM实习,在雅虎工作了一年半的时间,并且还取得了不错的成果,“或许正是因为自己的基础和资历都不突出的关系,我做任何事情时心态都非常好,态度很踏实,能做到干一行爱一行。
”“最初到雅虎工作的主要原因是想结束和女友的异地恋,”汤老师解释道,“同时也想看看,做科研项目和企业项目之间的差别。”在雅虎工作期间,汤老师也没有中断科研。汤老师每天早上5点起床,然后利用上班前五点到九点之间的空余时间做科研,下班后又继续钻研自己的课题。
汤老师发现,企业与高校之间工作还是有差异的。如何选择,就看哪种更加适合自己。在企业呆了一段时间后,汤老师还是觉得自己更加喜欢高校。
高校可以自己做主,根据自己的兴趣决定研究课题;企业内的研究课题是根据企业的市场定位、发展规划等诸多因素决定的。如果想做研究,企业模式下,很多个人感兴趣的研究是无法进行的,因为涉及隐私、专利等诸多限制。高校的科研工作,取决于自身研究兴趣,而且还可以培养学生,组建研究团队。相比而言,企业界的科研没有高校这么自由。公司项目大都是比较短暂的,完成一个就换另一个,市场导向明显。
高校学术研究可以根据兴趣和学术热点,进行未来5-10年长期项目的研究。
汤老师过去十年一直做图上的特征学习以及相关应用。在博士期间做图上的特征选择,是该研究方向的开创者之一。在博士后期到现在做图上的表征学习方面的研究。表征学习和特征选择不一样的地方在于,特征选择是在原有的特征中进行挑选,而表征是学习新的表达和特征。同时,汤老师还将研究扩展到社交媒体,电商和智能教育的应用中。
这三年来,汤老师的Google学术引用数从2000多一直很快的增加到12000多,一方面是因为汤老师和导师刘欢是研究特征选择方面的专家,所以他们的关于特征选择的论文都是最前沿的,都能够得到很多的关注。另一方面,汤老师是早期将深度学习用在图上做表征的研究者。此外,他也把在图上做表征学习和特征选择的算法进行了实际应用(比如说推荐系统,社交媒体)。
而近几年来随着深度学习受到越来越多的关注,在图上做表征学习也成为研究的热点。所以汤老师的相关工作得到的关注度也比较多。
汤老师对此打趣道:“就像雷军说的一样,猪在风口上也可以飞。”汤老师表示他们马上会出一本图深度学习的书,过去10年的领域做的事都会总结在这本书上。该书中英文将同时出版。英文原版由剑桥出版社出版,作者包括马耀和汤继良。
英文翻译版将由电子工业出版社出版,作者包括王怡琦、金卫、马耀和汤继良。除此之外,汤老师实验室其他研究包括开发高效率的,隐私保护的和具有鲁棒性的机器学习算法。汤老师组开发的关于机器学习对抗学习的工具包deeprobust,也得到了行业很多关注。
汤老师与KDD的第一次交集在2012年的北京。当时汤老师投了两篇一作论文,两篇都被选上了。
在之后的2015年曾获得KDD最佳博士论文的亚军,2016年还曾获得KDD最佳应用论文奖。因为感恩KDD所给予的机会,所以汤老师从2015年起便一直为KDD会议做一些力所能及的志愿者工作,如担任会议组织者与协调会议举办等。关于获得今年KDD新星奖,汤老师感触良多,将这份荣誉归因于一路陪伴自己、帮助自己成长的亲友、前辈与学生。
汤老师的导师给他带来了很大的影响,他从导师那里学到了如何引导学生,即要充分信任、了解、帮助和鼓励学生,毫无保留地教导学生,导师自己也要以身作则,营造融洽的团队氛围。谈起这次的评选,汤老师认为离不开恩师与多位前辈的提携,如提名他为候选人的刘欢老师,为他写推荐信的Charu Aggarwal、Anil Jain以及著名的社会学家H.Russell Bernard,和奖项的主席裴健老师和奖项评选委员会。
“作为导师,最重要的使命,就是要打造一个平台,让学生可以充分发挥自己的能力,自由地表达和发展。”汤老师认为,导师和学生之间不是上下级或者老板员工的关系,而是合作者和朋友的关系,在他的团队里,学生和他都是以名字相称,像朋友一样直呼他“JT”。
在汤老师当上老师的第一年,由于缺乏经费,实验室发不起自己和学生暑假的工资。但是如今,汤老师带领的DSB Lab已然成为人员齐备的团队。
汤老师说道,主要还是靠“敢想敢做”这四个字。在当时实验室没有任何经费的情况下,汤老师也硬着头皮请了四个学生,这是非常冒险的行为。如果实验室后面也没有拿到经费的话,第二年是不可能再运营下去的,这对于学生而言风险也很大。“在一个实验室里,最重要的是人,而不是经费。只有人才能作为良性循环的开始,启动科研项目,最后才能让项目获得承认,取得经费。所以即使经费不够,也要先招人。
实际上,我经常会招超出经费预算的学生,一方面是给我自己压力,一方面也让我更加重视学生本身。虽然第一年压力很大,但最怕的事情不是失败,而是不敢走出第一步。”好消息是,汤老师在第一年就获得了接近一百万研究经费。
汤老师的第一位博士生Tyler Derr已加入具有南方哈佛之称的范德堡大学计算机系担任助理教授,并开始招收第一个博士生。
今年,在Tyler准备入职面试时,汤老师原准备回国国春节,但因为与Tyler面试时间冲突,汤老师选择推迟行程,帮助Tyler一起准备。“我什么时候都能回家,推迟几天或者明年也行,但如果你面试不成功,可能会影响你一辈子。”“学生要勇敢地表达自己的想法,而不是一味地觉得导师说的都对。
”汤老师说道,“假如一个学生说我说的什么都对的话,我一般都不会喜欢这个学生,这样的学生最多就只能成为部分的我,而我希望我的学生能超越我,做的比我更好。”所以,汤老师在面试学生的时候,有自己独到的方法。他一般不会问技术性的问题,而是问一些在学术研究过程中会遇到的一些原则性问题,以此来评判学生的学术品质。
比如,他会问学生,“假如有A、B、C、D四位学生,你是A,实验室要投论文,因为时间紧急,只能投B、C、D的文章,你的论文就不能投了,你会怎么办?”汤老师解释自己的用意,“如果是真正在论文上花了时间和精力的,就会坚持要投自己的论文,或者至少让我说出足够的理由,才能同意不投自己的论文。这样的学生有主动学习的动力和不服的精神,我也更加看重这种学生。
”在汤老师这种不按套路出牌的面试中,学生都会表现得很放松,“当学生放松的时候,我才能更加了解他们真实的一面。很多时候我并不是选学生,而是选可以做一辈子的朋友”“到目前为止,该面试学生的方法还蛮奏效。招到的学生学习主动性强,敢想敢做敢拼”。
高年级的博士生如Tyler、志威、翔宇和马耀在顶会如KDD、AAAI和SIGIR多次组织研讨班(workshops)和讲习班(tutorials)并开始在行业的暂露头角。许涵,李雅欣,金卫和刘孝睿主动的开发了用于对抗学习的工具包deeprobust并设计了详细的文档。马耀、金卫和王怡琦编写了第一本详细的介绍图深度学习的书。
“无论何时,人都是最重要的。”汤老师如是说。