你也能自己造一只柯南的蝴蝶结变声器了

作者: 文摘菌

来源: 大数据文摘

发布日期: 2019-03-14

本文介绍了变声技术的发展,特别是通过机器学习和深度学习实现的变声软件,如Modulate.ai和百度的Deep Voice。这些技术不仅能够生成逼真的声音,还能克隆名人的声音,甚至用于视频合成。文章还提到了AI技术在图像和视频合成方面的应用,以及国内科技公司在语音合成领域的成就。

最近,一只“总统洋葱新闻”在Youtube和Reddit上引发了一波讨论。视频中,特朗普用它一贯懒散的声音播报了一组耐人寻味的新闻——“数据雨“:民主党人把太多数据存在运上,冷却后成为液体,最后通过降雨落下来,对地球生态造成巨大伤害。想要避免这种致命液体,你需要躲在屋里,不要出门。

虽然内容荒唐,但整个视频中的声音效果非常真实,以至于不少网友在捧腹大笑的同时也开始调侃,“是不是很快就能接到特朗普给我打的广告电话了。”再加上近期,“假脸”技术大肆盛行,与之配套的“假声音”上线后,更能生成无缝衔接的假视频,让假戏做足,真假难辨。

关于变音技术,江湖上确实流传了几种,不过加持了机器学习和深度学习,这种技术不再是简单的语音滤波器。

跟”一键变脸“的deepfake软件一样,研究者们也开发了让不懂技术的同学直接易上手的变声软件。刚刚听到的这个声音就来自这样一个网站Modulate.ai。麻省理工科技评论的资深编辑Will Knight用其轻易就合成了不同的声音。创建这个网站的三个小伙伴,有两个来自麻省理工,还有一个来自加州大学洛杉矶分校。

对于游客,这个网站给出了几个适用的声音,对于想定制名人声音的用户,还得通过官网给出的联系方式联系他们。据网站介绍,合成的声音是是采用神经网络训练来训练,具有低延迟性以及实时性。

此外,百度在18年的3月份曾经宣布,百度开发的新 AI 算法Deep Voice可以通过3.7秒钟的录音样本数据就能完美的克隆出一个人的声音。Deep Voice是百度AI研究院一个由深度神经网络构建的高质量语音转(TTS )系统。除了利用少量样本克隆声音外,系统还能将女性声音转变成男性,英式声音变成美式。

AI合成大事件通过AI技术合成图片以及视频早已不新鲜,要说最著名的合成案例可能就是下面这个。这项技术由华盛顿大学SUPASORN SUWAJANAKORN等三人共同发明,他们坦言,之所以选用奥巴马做研究范例,是因为他的高清视频资源获取非常容易,并且不受版权限制。因此,研究小组用神经网络分析了数百万帧的视频,来确定奥巴马的面部表情如何变化。

开口说话需要整个面部器官的协调,所以研究人员不仅分析了口型变化,还包括他的嘴唇、牙齿和下巴周围的皱纹,甚至还包括脖子与衣领。

UUID: 930e6916-568e-477c-af1d-059291d3e5d1

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2019/2019-03-14_你也能自己造一只柯南的蝴蝶结变声器了.txt

是否为广告: 否

处理费用: 0.0035 元