有了这个,你的PS可以不用学了

作者: 张鑫、三石

来源: 新智元

发布日期: 2018-08-29

该文介绍了一种新的图像语义处理分层框架,能够实现像素级的图像操纵,用户可以轻松改变图像中的对象特征,如颜色和位置,且与原图像自然融合。这项技术的核心在于结构生成器和图像生成器的协同工作,能够生成高质量的图像处理效果,预示着计算机视觉领域的重大变革。

曾经,你以为下面普京×容嬷嬷那张图就称得上“毫无PS痕迹”了。的确,用肉眼看,效果是很不错。但是,在专业的图像分析软件下,修改的痕迹一目了然。

你再看看这两张图:不不不,这不是“找不同”,是为了让你感受一下“像素级语义分割和理解”带来的修图效果:可能,你需要看得更清晰一点。看好了哦,这是原图:

发现有什么不同/不自然的地方了吗?(提示:一共有7处不同)。先别急着往下拉……

答案揭晓:实际上,找出不同是很简单的(毕竟多了好几个东西),关键是这样像素级的改动,比原先意义上“毫无PS痕迹”增强了一大步!无论是色调、光线还是纹理,都与原图配合得更加自然,操作起来也十分简单方便。

这多亏了密歇根大学和谷歌大脑的研究人员,他们提出了一种新的图像语义处理分层框架,首先根据图像中给定对象的边界框,学习生成像素级语义标签地图(pixel-wise semantic label maps),然后根据这个地图再生成新的图像。因此,用户可以实现对象级的操纵,无论是改变颜色、移动位置、去除某个物体,增加新的东西,或者把原来在最前面的人物往后移一层或两层,而且与原图像自然融为一体。

操作只需要一步即可:图像语义分层处理框架工作流程图示意:输入车道照片,输出上面有一辆车的照片。定量和定性结果分析,该方法比当前流行的Context Encoder、Pix2PixHD等效果都要高出许多。这有望掀起计算机视觉和图像处理界的巨变,难怪有人看完后在Twitter留言:“在我两年前开始学计算机视觉时,这种技术简直是无法想象的。”“简直是科幻变成了现实!

”还有人疾呼:PS里有个功能我现在就想要!

想必大家看到这个神级PS技术,对其原理应该是十分好奇了吧!正如上述所言,这个PS技术框架的核心就是分层图像处理。当给出新的边界框B时,算法首先通过以B为中心、尺寸为S×S的裁剪平方窗口,提取标签映射M∈R S×S×C和图像I∈R S×S×3的局部观测值。

在M,I和B上,模型通过以下过程生成操纵图像:给定边界框B和语义标签映射M,结构生成器通过预测操纵的语义标签映射;给定操纵的标签映射M和图像I,图像生成器通过预测被操纵的图像I。

而在分层图像处理过程中,有两个核心的关键步骤:1. 结构生成器(Structure Generator)结构生成器的目标是以像素级类标签M∈R S×S×C的形式推断由B = {b,c}指定的区域的潜在结构。

结构生成器的体系结构给定一个掩膜设计(masked layout) M和一个二元掩膜(binary mask)B,分别用于对目标的类和位置进行编码。该模型通过来自双流解码器的输出产生M(该双流解码器对应于box整个区域中对象的二进制掩码和语义标签映射)。

2. 图像生成器(Image Generator)给定一张图像I和从结构生成器中获得的可操纵layout M,图像生成器输出区域内由B定义的、内容的像素级预测。

为了分析所提方法的有效性,对该方法的几种变体进行了模型简化测试(Ablation Study)。首先考虑图像生成器的三个基线:仅限于图像上下文(SingleStream-Image);仅限于语义布局(SingleStream-Layout);对上述两个基线的结合。结果如下表所示:下图显示了基线的定性比较:

通过将汽车的同一个边界框移动到图像中的不同位置来展示操作结果,从图中可以看到,当把车的边框从一边移动到另一边的时候,模型所产生的车辆外观发生了变化。有趣的是,汽车的形状、方向和外观也会根据周围区域的场景布局和阴影而改变。

该结果表明,模型在考虑上下文的情况下生成了合适的对象结构和外观。除了生成与周围环境相匹配的对象外,还可以对框架轻松地进行扩展,允许用户直接控制对象样式。结果表明,模型成功地合成了具有指定颜色的各种对象,同时保持图像的其他部分不变。

图像编辑是该模型的关键点之一。通过添加、删除和移动对象边界框来执行交互式图像处理。该方法生成合理的语义布局和图像,可以平滑地增加原始图像的内容。

除了交互式操作之外,还可以通过以数据驱动的方式对图像中的边界框进行采样来自动化操作过程。由于室内图像中的对象涉及更多样化的类别和外观,因此生成与场景中的其他组件对齐的适当对象形状和纹理比街道图像更具挑战性。可以看出,该方法生成的对象与周围环境可以保持高度一致性。

UUID: 08cb8c0e-3823-40b2-bd8b-fe0d012f055a

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2018/2018-08-29_有了这个,你的PS可以不用学了.txt

是否为广告: 否

处理费用: 0.0083 元