最近,一只“总统洋葱新闻”在Youtube和Reddit上引发了一波讨论。视频中,特朗普用它一贯懒散的声音播报了一组耐人寻味的新闻——“数据雨“:民主党人把太多数据存在运上,冷却后成为液体,最后通过降雨落下来,对地球生态造成巨大伤害。想要避免这种致命液体,你需要躲在屋里,不要出门。
虽然内容荒唐,但整个视频中的声音效果非常真实,以至于不少网友在捧腹大笑的同时也开始调侃,“是不是很快就能接到特朗普给我打的广告电话了。”再加上近期,“假脸”技术大肆盛行,与之配套的“假声音”上线后,更能生成无缝衔接的假视频,让假戏做足,真假难辨。
关于变音技术,江湖上确实流传了几种,不过加持了机器学习和深度学习,这种技术不再是简单的语音滤波器。
跟”一键变脸“的deepfake软件一样,研究者们也开发了让不懂技术的同学直接易上手的变声软件。刚刚听到的这个声音就来自这样一个网站Modulate.ai。麻省理工科技评论的资深编辑Will Knight用其轻易就合成了不同的声音。创建这个网站的三个小伙伴,有两个来自麻省理工,还有一个来自加州大学洛杉矶分校。
对于游客,这个网站给出了几个适用的声音,对于想定制名人声音的用户,还得通过官网给出的联系方式联系他们。据网站介绍,合成的声音是是采用神经网络训练来训练,具有低延迟性以及实时性。
此外,百度在18年的3月份曾经宣布,百度开发的新 AI 算法Deep Voice可以通过3.7秒钟的录音样本数据就能完美的克隆出一个人的声音。Deep Voice是百度AI研究院一个由深度神经网络构建的高质量语音转(TTS )系统。除了利用少量样本克隆声音外,系统还能将女性声音转变成男性,英式声音变成美式。
AI合成大事件通过AI技术合成图片以及视频早已不新鲜,要说最著名的合成案例可能就是下面这个。这项技术由华盛顿大学SUPASORN SUWAJANAKORN等三人共同发明,他们坦言,之所以选用奥巴马做研究范例,是因为他的高清视频资源获取非常容易,并且不受版权限制。因此,研究小组用神经网络分析了数百万帧的视频,来确定奥巴马的面部表情如何变化。
开口说话需要整个面部器官的协调,所以研究人员不仅分析了口型变化,还包括他的嘴唇、牙齿和下巴周围的皱纹,甚至还包括脖子与衣领。