麻省理工团队开发出的编辑界面正在演示如何重写规则以让笑容复制到其他图片上。通过重写规则生成的马戴着帽子的图片。这项研究发表在本月的欧洲计算机视觉会议上,标题为“Rewriting a Deep Generative Model”。在ECCV上的介绍中,该研究的主要作者、麻省理工学院的博士生David Bau演示了如何使用团队设计的直观界面来进行模型重写。
他从一张图片中复制一棵树,然后将其粘贴到另一张图片中,让人难以置信的是,他把树放在了一座建筑的塔楼上,然后,这个模型就会制作出足够多的树木发芽的塔楼的图片。在另一个案例中,Bau就将帽子从骑手转移到马身上。团队在ECCV Oral的视频中展示了为什么要“重写”GANs。
生成对抗网络(GANs)是一种深度学习模型,已经成为人工智能领域的一个研究的热点,为无监督的学习注入了新的活力,被称为近十年来最有趣的想法。GANs基本思想源自博弈论的二人零和博弈,它主要构造了两个神经网络:生成器和鉴别器,实现方式就是让两个神经网络互相竞争训练,最后达到一种平衡状态,从而创造出超现实的图像和声音。但是这项新的研究表明,大数据集并不是必不可少的。
Bau认为,如果你深入了解了模型的连接方式,那么即使没有文字说明,你也可以编辑其中的数字权重来让算法实现你所需的行为,类似的,就算没有合适的数据集也可以解决问题。训练和重写之间的区别,就好比自然选择和基因工程的区别。虽然训练可以有效优化全局目标,但它不允许直接指定内部机制。相反,重写允许用户直接选择希望包含的内部规则,即使这些选择碰巧与现有数据集不匹配。重写的关键是OLAM。
重写模型构想了一种根据用户意图构建深度网络的方法,不仅可以将模型限制为模仿已经拥有的数据,还可以使深度网络对遵循用户希望拥有的新规则的世界进行建模。作者们发现,通过重写现有网络中的规则来创建这样的模型是可行的。研究者可以像分层蛋糕一样切开GANs,分离那些已经学会绘制特定特征的人造神经元。
基于这一见解,团队先是创建了GANPaint,这是一个允许用户添加和删除图片上的草、木、云、砖瓦和门等功能的工具,其中的每个工具都对应GAN中的其中一组神经元,只要激活其中的某一组神经元,抑制其他的神经元,就可以有选择地生成想要的要素。尽管如此,该工具仍可立即应用于广泛研究GANs的计算机图形学领域,以及训练AI系统以通过数据增强识别稀有特征和事件。
该工具还可帮助研究人员更容易了解GANs如何在最少的人工指导下学习视觉概念。如果模型通过模仿它们看到的东西来学习,并在这个过程中形成关联,那么它们可能会成为新型机器学习应用的跳板。