“你说什么?听不见!再说一遍!”在震耳欲聋的音乐节现场或者吵闹的酒吧,我们和他人交往的唯一方式只能“贴近耳边开吼”,此时此刻,真是恨不得有一个开关让全世界都静音,只让对方开口说话。不过,这个梦想终于有可能变成现实了,载体却是一副眼镜。
最近,Facebook旗下的“Facebook现实实验室”(简称FRL),公布了2项新突破:一种让人在嘈杂环境中听清楚自己想要的信息,同时调低背景噪音;另一种让耳机里的声音保真度高到无法与现实世界的声音区分开来。当这两项神奇的技术被集成在一副可穿戴设备AR眼镜上,会发生什么神奇的事情?
首先,这款AR眼镜上有多个麦克风,可以捕捉佩戴者周围的声音,同时记录他的头部和眼镜的运动模式,找出他最感兴趣的声音,并消除其他背景噪音。这样即使在嘈杂的环境中,也可让佩戴者清晰地听到他想要的声音。
Facebook团队采用的是名为“近场波束形成”的技术——麦克风按照一定的形状和规则布置的阵列,即麦克风阵列,是对空间传播信号进行采样的装置。
根据声源和麦克风阵列距离的远近,声场模型分为近场模型和远场模型。大多数的麦克风阵列语音增强方法,建立在声源位于阵列远场的假设基础上。这种语音增强模型在大房间会议室中有比较好的应用,但如果房间较小,声源和麦克风距离较近,这种语音增强模式性能就急剧下降。研究证明,在小房间混响条件下,近场波束形成技术可以有效抑制噪音、提高语音信号质量。
这种“感知超能力”(perceptual superpowers),可能给听障人士带来新希望。根据2019年世卫组织的数据,全球大约有4.66亿人患有残疾性听力损失,超过全世界人口的5%,其中有3400万是儿童。不过其中许多人因为费用、不适感、社会耻辱感等问题没有使用助听器。AR眼镜将有可能提高听障人士的生活便利性,增强他们的社交生活。
另外,对普通人来讲,长时间暴露在85分贝以上的噪声水平下,可能导致听力下降。只听想要的声音而降低背景噪音,延长耳朵的服役年限,年纪大了还能耳聪目明。
新冠疫情期间,在家办公的上班族要想开会,就只能通过视频会议平台,而这种方式依然让人觉得有距离,不如面对面谈话来得亲切。Facebook另一项“音频存在”(audio presence)技术,就是让人难以区分现实世界的声音和耳机里的声音,呈现逼真的音效效果。这样你在打视频电话时,即便对方处在另一个半球,听起来却好像就在你面前。
FRL介绍说,希望这副眼镜能够改变穿戴者感知外部世界的视觉和听觉维度,呈现一个更加个性化定制,更加友好的外部环境,比如当你走进一家餐厅时,AR眼镜就会自动识别你周围发生的不同类型的事件:人们的对话,空调的噪音和餐具的叮当声,然后为你做出智能决策。
不过Facebook的雄心不止于此,他们希望用AR眼镜加上自己的AR增强实时地图LiveMaps(可以把它看做一个三维实景版的谷歌地图),打造一个全新的真假交织的世界。人们可以以全息图的形式周游世界,参观新的地点,和远方的家人吃饭。当孩子们路过一只小动物时,相关的信息会从动物旁边弹出,让孩子获得更强的参与感。
当然,等技术成熟也需要时间。Facebook的首席科学家对路透社表示,距离这款AR眼镜彻底成熟,变成面向市场的可穿戴电子设备,还有大约5-10年的时间,不过光是想象,就已经让人足够激动。