作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉、分类等领域上,都取得了当前最好的效果。卷积神经网络的发展,最早可以追溯到1962年,Hubel和Wiesel对猫大脑中的视觉系统的研究。
1998年,著名计算机科学家Yann LeCun在论文Gradient-Based Learning Applied to Document Recognition中提出了LeNet-5,将BP算法应用到神经网络结构的训练上,形成了当代卷积神经网络的雏形。直到2012年,AlexNet网络出现之后,神经网络开始崭露头角。
在Imagenet图像识别大赛中,Hinton组的论文ImageNet Classification with Deep Convolutional Neural Networks中提到的Alexnet引入了全新的深层结构和dropout方法,一下子把error rate从25%以上提升到了15%,一举颠覆了图像识别领域。
此后卷积神经网络声名大噪并蓬勃发展,广泛用于各个领域,在很多问题上都取得了当前最好的性能。2015年深度学习领域的三巨头LeCun、Bengio、Hinton在Nature上发表一篇综述文章Deep Learning,系统地总结了深度学习的发展前世今生。
在2016年,CNN再次给人们一个惊喜:谷歌研发的基于深度神经网络和搜索树的智能机器人“AlphaGo”在围棋上击败了人类,更惊喜的是谷歌在Nature专门发表了一篇文章来解释AlphaGo,文章名字为Mastering the game of Go with deep neural networks and tree search。
随后利用了ResNet和Faster-RCNN的思想,一年后的Master则完虐了所有人类围棋高手,达到神一般的境界,人类棋手毫无胜机。后来又有很多复现的开源围棋AI,每一个都能用不大的计算量吊打所有的人类高手。可以说,卷积神经网络是深度学习算法应用最成功的领域之一。研读卷积神经网络的经典论文,对于学习和研究卷积神经网络必不可缺。
根据相关算法,AMiner从人工智能领域国际顶会/期刊中提取出“卷积神经网络”相关关键词,筛选并推荐了100篇经典必读论文。这100篇论文大多发表于2015年至2019年间,主要发表在CVPR、ICCV、ICML、NeuIPS等计算机视觉顶级学术会议上。在该领域发表论文最多的学者中,“神经网络之父”、“深度学习鼻祖”Hinton与Bengio双双上榜,为深度学习研究持续贡献了力量。
按照这100篇经典论文的被引用量,我们挑选了其中的TOP10作简单评述。Fully Convolutional Networks for Semantic Segmentation(CVPR2015)引用量:13136。论文作者:Jonathan Long,Evan Shelhamer,Trevor Darrell。作者单位:UC Berkeley。
论文地址:https://static.aminer.cn/upload/pdf/program/5550415c45ce0a409eb3aa1e_0.pdf。本篇论文是神经网络大神Jonathan Long与他的博士同学Evan Shelhamer、导师Trevor Darrell的代表作,获得了CVPR 2015年最佳论文奖。
该文的核心贡献,在于提出了全卷积网络(FCN)的概念,它是一种可以接受任意大小图像并输出与输入等大的图像的全卷积神经网络。CNN近年来发展迅速,在图像领域更是主流方法,驱动着物体检测、关键点检测等的发展,但CNN对于图像语义分割却在时间和精度方面都表现不好。本文提出了FCN,针对语义分割训练一个端到端,点对点的网络,达到了state-of-the-art。
这是第一次训练端到端的FCN,用于像素级的预测;也是第一次用监督预训练的方法训练FCN。