深度模型有高超的学习(数据拟合)能力,但为了提高模型的泛化能力、让模型在新的数据上也有好的表现,我们需要寻找一些方法干扰模型的训练过程,避免模型“记住”训练数据,这就是正则化。本次报告邀请了斯坦福大学计算机科学和统计学助理教授马腾宇博士,他将给大家带来的报告题目是《为深度模型设计显式正则器》,在这次分享中,马腾宇老师会介绍一些近期的显式正则化方法。
设计显式正则器以提高深度神经网络的推广能力,推导深度神经网络基于数据依赖的推广边界,并根据经验对边界进行规范化,以在标准精度或稳健精度方面获得改进的推广能力,最终将这些技术应用于不平衡数据集等最新研究结果。
马腾宇博士现为斯坦福大学计算机科学和统计学助理教授。主要研究领域包括机器学习和算法,如非凸优化、深度学习及其理论、强化学习、表示学习、高维统计等。
已在国际顶级会议和期刊上发表高质量论文40多篇。获得2018 ACM博士论文奖荣誉奖(Honorable Mentions),NeuRIPS 2016最佳学生论文,COLT 2018最佳论文奖。本科就读于清华大学交叉信息研究院,是2008级“姚班”学生。毕业后前往美国在普林斯顿攻读博士学位,期间师从Sanjeev Arora教授。
时间:2019年12月30日16:00-17:40(15:30签到)
地点:北京大学科技园创新中心报告厅
活动日程:
报名通道:
扫码报名
阅读原文