100年前晚清影像喜提热搜,AI修复技术再现历史

作者: CSDN App

来源: CSDN

发布日期: 2020-05-14

近日,一段100年前北京晚清的影像通过AI技术修复后喜提热搜,使得老旧的黑白影像变得更加清晰,甚至有了颜色。修复影像背后使用的AI技术,如DAIN和Gigapixel AI,使得视频分辨率和流畅度显著提高,为虚拟现实构建提供了灵感。

前几天,一条“100年前北京晚清的影像”喜提热搜,博主用AI技术修复了一段10多分钟的古董视频,使得100多年前老旧的黑白影像变得更加清晰,甚至有了颜色。这段时长10多分钟视频使用了AI修复技术,评论中有人表示,隔着屏幕与画面中的人物对视,恍然间有种时空交错的感觉,很神奇。除了被修复的珍贵影视资料本身,笔者更加关心的是修复影像背后使用的神奇AI修复技术。

在微博Up主的文案标明,修复影像的技术管线参考自开发人员,同时是一名YouTuber的Denis Shiryae上传的影像修复教程。循着这个线索,笔者发现原来这位大神早就在YouTube上发布过一些关于AI修复影像的视频。

比如这段用神经网络对1906年大地震前的旧金山影像进行修复的视频,解说中说到,他只做了一套神经网络工作流来做视频的修复与像素倍增,其中用到了DAIN进行帧内插,ESRGAN在自定义数据集上进行帧升级,然后用DeOdify来做视频着色,这些算法都是公开的,感兴趣的话都可以搜索软件,然后搞事情。

另外,Denis修复的一部1896年的黑白短片The Arrival of a Train at Station项目也非常有趣,同样也是使用公开的AI技术将其转换成了4k高清视频,并且可以以每秒60帧进行播放。结果虽然不完美,但同样让人惊艳。可以看到,修复的结果并不十分完美。整个画面和动态中都存在一些特征性的“平滑”和奇怪的伪像,这都是在大量插帧时会出现的典型现象。

但是对于大多数人(在大多数设备上)来说,这种效果还是像魔术一样神奇,修复后的画面中,人们的衣服和火车的细节清晰可见,画面流畅同步,可视距离变长。

有意思的是,这部电影上映时,因为人们从未见过一辆火车径直冲着观众冲过来的动态镜头,很多观众一度受惊被吓得跑出电影院,这部短片也被称为“电影的奠基神话”,流传为一段佳话。

为了实现高清修复,Shiryaev使用了两种神经网络:Google的DAIN(深度感知视频帧插值,Depth-Aware Video Frame Interpolation)和Topaz Labs的Gigapixel AI。其中,Gigapixel AI用于将微弱分辨率的视频一直扩展到4K,而DAIN用于创建和插入之前不存在的帧,从而将视频的FPS增加到60。

Gigapixel AI,随着图片放大,它可以对图片进行细节填充。具体的实现方法,是通过分析按比例缩小的大量图像,了解丢失的信息。经过训练,当图片放大时,Gigapixel AI可以自动弥补图像损失的细节,让画质效果更佳。这项技术也被打包放进了Topaz Gigapixel AI软件中,使用软件就可以对图像“无损”放大,亲测效果还不错。

第二个算法是由Google工程师团队和一些研究员开发的插帧算法DAIN添加的。DAIN也像Gigapixel AI一样可以填充细节,但却是插入整个图片而不是单个像素,从而将帧速率提高到每秒60帧。当然,AI使用现有的大量视频作为训练材料,通过评估前后帧以及镜头中的不同深度水平,以找出缺失的信息。

上图为DAIN的架构图,工作原理大致为给定两个时刻的输入帧,先估计光流和深度图,然后使用建议的深度感知流投影层生成中间流。然后,模型基于光流和局部插值内核对输入帧、深度图和上下文特征进行扭曲,合成输出帧。这种模型紧凑、高效且完全可微分。定量和定性的结果表明,DAIN在各种数据集上均优于最新的帧插值方法。

DAIN已经在GitHub上开源,感兴趣的同学可以详细研究一下:https://github.com/baowenbo/DAIN。有一点需要说明,我们在此修复中看到的所有额外细节可能实际上并不是镜头中的真实内容,而是算法在经过大量类似照片和视频库中训练给出的最接近真相的预测。

原版短片是由Lumière brothers拍摄的,摄像机使用了35mm胶卷(这种胶卷还可以作为投影仪使用)。

另外还应该指出的是,和线上那些低分辨率的盗版电影相比,Shiryaev使用的原始视频质量相对较高,这可能要归功于先前的修复技术。不幸的是,源视频并没有提供任何有关制作方式的详细信息,但似乎已经用某种方法进行了数字化增强。无论原版影片是否经过处理,修复后的新版本的分辨率和流畅度都有了明显的提高,这就够了,因为这为我们用AI引擎构建虚拟现实提供了很多灵感。

尽管人们对Deepfake的照片和视频忧虑重重,这门可以虚构从未存在场景的技术经常因为负面新闻出现在头条,但是类似的修复图像技术可以还原历史,带给人们的价值,显示出神经网络的积极作用。总之,任何好用的技术本质上都是一把双刃剑,不能因噎废食,为了更好地使用这把利器,更多地需要从法律法规等途径进行约束,创造更好的环境,是不是这个理儿?

UUID: b3fa4ff3-a538-46cd-b932-b301977aa829

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2020年-上/2020-05-14_AI修复100年前晚清影像喜提热搜,有穿越内味儿了!.txt

是否为广告: 否

处理费用: 0.0046 元