你的耳机要被AI颠覆了:只需看一眼,整个世界都是TA的声音

来源: 学术头条

发布日期: 2024-05-28 17:12:39

华盛顿大学研究团队开发出一种人工智能耳机系统TSH,佩戴者只需注视目标说话者3-5秒钟,即可锁定并只听该说话者的声音,消除其他环境噪音。该系统还可移除特定人的声音,未来有望扩展到耳塞式耳机和助听器。

在大多数情况下,现代生活是十分嘈杂的。如果你不喜欢周围的喧嚣,你可以选择戴上降噪耳机,屏蔽你身边的吵闹声音。然而,一个问题是目前降噪耳机会不加区分地过滤掉所有声音,其中就包括一些你真正想听到的声音。尽管苹果的第二代AirPods Pro可以自动为佩戴者调整声音大小,例如,当佩戴者正在交谈时,它就会自动感应到,但他们几乎无法决定聆听谁的声⾳或何时聆听。

如今,一项新的人工智能(AI)技术,或将催生出一款颠覆传统的耳机——只需看一眼,整个世界都是TA的声音。来自华盛顿大学的研究团队开发出了一种人工智能耳机系统——Target Speech Hearing(TSH),佩戴者只需注视目标说话者3-5秒钟,就可以将其“锁定”,消除环境中的所有其他声音,只选择听被“锁定”说话者的声音。

即使佩戴者在嘈杂的地方走来走去,不再面对说话者时,TSH系统也能正常运行。

研究团队表示,TSH系统不仅可以只听某一个人的声音,还可以只移除某一个人的声音。这在某些情况下会很有帮助,比如你想过滤掉一个人的干扰性讲话,同时还能听到其他人的讲话。目前,这一概念验证设备的代码已可供他人使用,但尚未投入商用,他们正在商谈将其嵌入流行品牌的降噪耳机中。此外,在未来的工作中,他们希望将TSH系统扩展到耳塞式耳机和助听器。

然而,这项研究也存在一些局限性。例如,目前的TSH系统一次只能“锁定”一个说话者,而且只有在说话者的同一方向不存在另一个更大的声音时,才能锁定目标说话者。在之后的工作中,研究团队希望将TSH系统扩展到支持同时“锁定”多个目标说话者。他们提出了两种可能的方法:为每个说话者运行一个单独的网络实例,或者训练一个能够同时处理多个说话者的网络。

UUID: b250ffb9-2141-4253-8f70-c6341baa072a

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2024年/学术头条_2024-05-28_你的耳机要被AI颠覆了:只需看一眼,整个世界都是TA的声音.txt

是否为广告: 否

处理费用: 0.0036 元