如果你是热门综艺节目《演员请就位》的粉丝,估计你最大的槽点就是,为什么现在的流量明星们演技如此堪忧?有什么办法能够把导师团那些老戏骨的演技,迅速移植到舞台上那些流量明星身上?也许,基于人工智能图像识别/生成技术的Deepfake,能够提供解决方案。当然,Deepfake技术现阶段的名声不大好,因为最“主流”的应用场景,就是成人色情影像的“明星换脸”。
除了这些,Deepfake还有“正道”可行吗——还真有,今年年初,一名来自芝加哥的龙套男演员刘易斯·惠勒(Lewis D. Wheeler)在新冠疫情横行,几乎揭不开锅的情况下,接到了一份特殊的“演出通告”:麻省理工学院两位视觉艺术家,佛朗西斯卡·帕内塔(Francesca Panetta)和哈尔西·布根地(Halsey Burgund),请他出演美国前总统理查德·尼克松。捕捉演员的声音和动作。
一到片场,哦不,麻省理工学院的虚拟现实实验室,惠勒才知道这个通告和自己以往所接到的完全不一样:自己被看中的原因,并不是因为容貌酷似尼克松,而是因为相似的声线。而他所要做的,就是一字一句地模仿这位前总统的说话方式,把1969年阿波罗11号登月万一失败后,尼克松新闻发布会将采用的预备演讲稿一小段一小段地通读一遍。同时,惠勒的嘴部动作被研究人员利用动态捕捉技术收集,再与尼克松的脸部模型精确匹配。
另外,利用自然语言生成技术和深度学习技术,惠勒朗读的音频则与尼克松原本的声音文件相混合,听起来更加流畅自然。随后,一段完美无缺的“恶搞旧闻”式视频诞生了:尼克松一脸沉重地召开新闻发布会,宣布阿波罗11号的登月行动不幸失败。当然,麻省理工虚拟现实实验室花了那么大力气,并不是为了做个假有声视频给自己在社交媒体上涨粉,而是在探索如何优化人工智能图形识别与生成技术,并完美地将视觉效果与声音融合在一起。
毕竟,现有的Deepfake技术也很难实现电影层级的“一键换脸”,在手机视频上看到的小缺陷,比如表情和嘴部动作不协调,在大银幕上会被放大数倍,产生严重的违和感,如果非要应用于电影,也需要大量手动的微调才能确保高质量,而价格更是令影视公司望而生畏:高端的视觉效果通常每分钟要花上数百万美元——还不如直接请大明星加入卡司呢!
直到今年6月,迪士尼的研究人员才展示了第一款具有百万像素分辨率的Deepfake模型,比传统模型的256*256分辨率高得多,接近逼真效果。但它的功能也相当受限,只能应用于那些人物形象直视镜头,光线充足的视频,如果拍摄角度与光线不佳,效果就会大打折扣。
当然,很多独立视觉艺术家,也在坚持用Deepfake技术结合真人演员,拍摄一些明星与名人的“换脸”短视频,但他们一般会在视频放上Youtube或其他流媒体平台时,提示观众这并不是真实的影像,而是某种“戏仿视觉艺术”。
比如一位前卫视觉艺术家巴纳比·弗朗西斯(Barnaby Francis)就在instagram上拍摄了一系列名人Deepfake 视频,从英国首相鲍里斯到好莱坞名媛金·卡戴珊,借助这些名人形象之口,来反思一些尖锐的社会议题,比如网红应该如何看待“黑粉”,以及网络平台该为公众个人隐私的泄露负什么样的责任。
当然,对于中国网民来说,成熟的Deepfake技术最受欢迎的应用方向,可能就是把国产小鲜肉的脸换到专业演员的脸上来,用以拯救他们的演技。这样真是一举两得,老戏骨们可以重返片场开工,而你的偶像也能瞬间变身演技派,一颦一笑之间回味无穷,追剧再也不用开两倍速了!