王鹏帅:从清华到微软,科研需要创造力

来源: 学术头条

发布日期: 2022-04-26 16:52:28

王鹏帅从清华大学到微软亚洲研究院的科研历程,强调了科研中的创造力和对专业魅力的沉醉,以及在科研道路上不断克服困难和挑战的过程。

今年1月,AMiner团队推出AI 2000榜单,旨在通过AMiner学术数据在全球范围内遴选过去十年间,人工智能学科最有影响力、最具活力的顶级学者,标榜他们对于人工智能研究领域的卓越贡献。本次学术头条有幸对入围这一名单的微软研究员王鹏帅进行了采访。本科清华、保研,仅是这两个标签,王鹏帅的学霸形象已经跃然纸上。在神仙打架的顶尖学府中,他更是直博进入清华大学高等研究院。

不到十年,从刚入大学的愣头青到崭露头角的科研新星,再到进入微软亚洲研究院,王鹏帅一路“升级打怪”,不断成就自我。每个人的成长都有自己的时区,而王鹏帅的时区,一向比多数同龄人走得更快。2009年进入清华读本科,2013年拿到保研资格后,他锁定了久负盛名的清华高等研究院(后文简称高研院),当时高研院正招收计算机方向的博士生,主攻计算机图形学与计算机视觉研究。

但只是一名本科生的王鹏帅,能顺利通过面试,成功拿到直博资格吗?王鹏帅坦言,其实当时自己并没有想太多,只是觉得既然有这么一个机会,何妨一试?更何况自己已经坚定继续在学术道路上深耕,高研院也是心中向往所在。于是,凭借扎实的知识基础和优异的成绩,他顺利进入高研院,从此开启了计算机图形学研究的第一步。时间齿轮转动不停,2018年博士毕业,王鹏帅正式进入微软亚洲研究院,继续“揭秘”三维图像的分析与构建。

这一切看似水到渠成,但他笑着说:“或许看起来我前行的速度还算快,但实际上,我的钟表也有走得很慢的时候。”博士第一年,王鹏帅就敏锐地觉察到与本科学习的天差地别。“本科时主要的任务是掌握知识,所学的东西都是已知的、现有的,突然到博士之后,是要去探索学术前沿,探索未知的东西。”尽管本科期间,他也参与过实验室项目,积累了一定的科研经验,但博士期间,如何得到创新型产出才是最能体现价值所在的东西。

这时,王鹏帅深感自己的时区似乎跟不上别人了:“看到周围的同学都有非常高质量的论文产出,而我直到博二上学期,都还没有论文发表。当时内心其实非常着急甚至焦虑起来。”即使是常人眼中的大学霸,也有晚上睡不着、稍有噪音就惊醒的煎熬时光。但不怕困难的精神始终在潜意识中支撑着他,很快,他认识到问题的关键,并非在于“是否有论文发表”这一结果,而在于“是否做好了手头上的课题”这一过程。

同时,他也感谢当时老师们对自己的开导和帮助。“老师们给了我很多信心,比如在选题、课题的研究方向以及做实验方面都给予了非常细致的指导,这让我更加坚信,高质量的付出最终一定会有收获。”量变终会达成质变——2015年,王鹏帅的一篇论文完成,并顺利发表在了计算机图形学顶级期刊ACM Transactions on Graphics上。

对于这段不太顺利的时光,他有很大感悟:“刚入学时面临从输入到产出的转变,这应该是很多博士生都会有的烦恼。不过我相信,焦虑是思想层面的,只要尽量不让其影响行动层面,那么最后你的行动是可以反过来影响思想的。”科研路上,困难只是小小插曲,对王鹏帅来说,更多的是对专业魅力的沉醉。谈起自己印象最深刻的一项工作,他语气更加活跃,似乎透过侃侃而谈的声音,都能看见一双饱含活力的眼睛。

那是他在博士期间所做的一项有关三维形状分析的研究。2012年,卷积神经网络(CNN)在二维图像理解上的应用引爆了计算机视觉领域,人们的目光被这样一种高效的计算机模型深深吸引。然而,CNN虽然在二维图像上表现极好,当被应用于三维形状时却困难重重。三维形状有很多种表达,比如点云、三角形网格、三维体素等。

其中体素表达和二维图像在概念上最接近,因此将CNN推广到三维的一种最直接的方法是将卷积运算作用在三维体素上。然而这一方法的内存和时间开销却非常大,因为假如一张二维图片的分辨率为N,其像素数量大概是N2,而若是三维体素表达的形状,体素数量会暴涨为N3。而经过不断探索与观察,王鹏帅团队发现,三维形状在本质上还是二维的。

例如当车载雷达扫描到行车或行人时,实际上生成的点云并未将三维空间占满,仅仅占用三维空间中的某个曲面,三维空间的绝大部分区域都是空的,这就是三维数据的稀疏性。基于这一观察,他们创造性地提出了三维稀疏卷积,即将神经网络的运算和存储限制到稀疏的非零信号上,而对于三维空间中信号为零的区域(即空的区域),其卷积运算被直接忽略,因此极大地改善了神经网络运行的内存和时间开销。

为了在GPU上高效地实现稀疏卷积,他们采用了图形学中经典的八叉树的数据结构来高效地组织稀疏的非零信号。这就是他们提出的基于八叉树的稀疏卷积神经网络(O-CNN)。在输入分辨率比较高的时候,相对于基于体素的三维CNN,该方法在内存时间效率上都达到了上百倍的提升。

而且王鹏帅提到,稀疏卷积的概念被广泛应用到各种三维分析任务中,直到现在,O-CNN在大型数据集上(比如ScanNet)也能够取得非常顶尖的性能。现在,他继续在该领域深耕:“三维数据的表达非常丰富,导致现在为止还没有一个通用的神经网络框架,所以我希望能够继续把我们的方法加以完善,最后找到一种通用的方法,能够同时处理不同表达的三维数据,而且能够应用于不同的任务,例如分析、生成甚至仿真任务。

”听到此处,小编不禁好奇:究竟是什么让王老师对科研保持如此热忱呢?他回答说:“可以说从本科开始,我就常常想,要成为一个有用的人才,为国家或者说为社会做贡献。选择科研这条道路时,我更希望能够做出一些有影响力的研究,当看到这些成果真的能够推动某个领域的发展,这也是实现自我价值、为国家和社会做贡献的一种方式吧!”对于科研人员做好研究的关键,他认为主要有三点:好的环境,培养创造力,和保持好奇心。

他首先分享了一个小故事:曾经在高研院的一位物理专业同学在攻读物理博士一年后,发现对计算机方向很感兴趣,与老师们沟通后,都很支持他转到了计算机方向,后来这位同学也做出很多优秀的成果。“无论是在清华高研院还是在微软,我都感激大家创造了一种开放自由且激励人的研究环境,我觉得这是非常难能可贵的。”目前,王鹏帅也指导着同门师弟在微软进行实习,他经常和师弟分享经验——做研究需要关注深度。

每个人的精力都是有限的,在刚开始做科研的阶段,更应该抓住一个关键点不断深挖,达到连点成线的效果。第三点就是科研人员的创造力非常重要。诚然,要想做出好的研究和成果,付出大量时间和努力是必须的。但王鹏帅也有自己的小妙招:时间投入不一定局限于坐在工位上,他经常将论文打印出来带在身上,无论是吃饭、锻炼还是坐车的空隙,都会拿出论文读一读,或是不断地思考问题。

他相信:“凡是想要做出一番成绩的人,在时间上的付出不可能很短,而且更多时候付出的都是隐性时间。”

UUID: b33befcf-f3c4-47bf-95b5-4a959afdc73e

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2022年/学术头条_2022-04-26_王鹏帅:从清华到微软,科研需要创造力.txt

是否为广告: 否

处理费用: 0.0070 元