CVPR 2020 已落下帷幕,共计投稿 6656 篇,录用 1470 篇,涵盖的方向包括目标检测、目标跟踪、图像分割、人脸识别、姿态估计、三维点云、视频分析、模型加速、GAN、OCR 等。
对话顶会,探索最新学术进展,本次分享 AI TIME 特地邀请到 CVPR 2017 最佳论文得主、世界人工智能大会 Super AI Leader(SAIL)先锋奖得主、来自清华大学自动化系的黄高老师为大家解读本届 CVPR“最佳论文”和“最佳学生论文”背后蕴含的亮点,深入剖析其核心思路、创新点,谈谈它们对 CV 领域的启发。
在严苛的录取标准下,《Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild》荣获 CVPR 2020 最佳论文称号,其第一作者为牛津大学视觉几何组博士生吴尚哲。图像是如何得来的?图像是由相机对着物体拍摄形成的,拍摄的过程涉及视角选择问题比如俯视还是仰视。
本届最佳论文的亮点就在于给定一张图像,它可在解构拍摄视角的同时,将其深度(3D)、光照等分解出来,真实可靠地“还原”出物体原始面貌。
AI Time 是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子。AI Time 旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,为大家打造一个知识分享的聚集地。
CVPR 2020 的最佳学生论文奖由来自西蒙弗雷泽大学和谷歌研究院的三位研究者摘得,获奖论文是《BSP-Net: Generating Compact Meshes via Binary Space Partitioning》,即通过 BSP(Binary Space Partitioning,二叉空间分割)构建紧凑的 3D 网格。
这篇论文介绍了多边形网格在深度学习特别是 3D 形状生成中的运用。多边形网格在数字 3D 领域中无处不在,但它们在深度学习革命中仅扮演了次要角色。学习形状生成模型的领先方法依赖于隐函数,并且只能在经过昂贵的等值曲面处理过程后才能生成网格。
在解读完最佳论文和最佳学生论文以后,关于这两篇论文对 CV 领域发展的启发,黄老师抛出了一些自己的观点。面向的任务 CV 未来的面向的任务,黄老师认为比较重要的有两个大的方向:3D 和 Video。计算机视觉是一门研究如何使机器“看”的科学,为的就是模拟人类视觉,解决人类视觉可以完成的事情。
对话顶会、解读最佳、碰撞思维、寻求启发,感谢黄老师的精彩解读以及独到观点,在分享自身见解的同时也启发了大家对于 CV 领域的思考。希望本次分享对大家的 CV 学习之路有所帮助,我们下次分享见!