科技| AI耳机技术降噪有得拣 灭声有理耳根变清净

加拿大都市网

[星岛综合报道] 几乎所有使用过降噪耳机的人都知道,在正确的时间听到正确的声音十分重要。有人可能想在室内工作时消除汽车喇叭声,但在繁忙的街道上行走时则不会。然而,人们无法选择他们的耳机取消哪些声音。

现在,华盛顿大学研究人员领导的一个团队开发了深度学习算法,让用户可以实时挑选耳机中过滤的声音。该团队称这个系统为“语义听觉”(semantic hearing)。耳机将捕获的音频串流到连接的智能手机,该手机取消所有环境声音。耳机使用者可以通过语音命令或智能手机应用程式选择他们想要包括的声音,从20个类别中选择,如汽车响号、婴儿哭声、讲话、吸尘器和鸟鸣。只有选定的声音才会通过耳机播放。

华盛顿大学的Paul G. Allen电脑科学与工程学院教授、资深作者Shyam Gollakota表示:“了解鸟的声音是什么样子,并从环境中的所有其他声音中提取出来,需要实时智能,这是今天的降噪耳机尚未实现的。挑战在于,耳机使用者听到的声音需要与他们的视觉感官同步。你不能在某人对你说话后两秒钟才听到他的声音。这意味着神经演算法必须在不到百分之一秒的时间内处理声音。”

由于这个时间压力,语义听觉系统必须在像是连接的智能手机这样的设备上处理声音,而不是在更强大的云端伺服器上。此外,由于来自不同方向的声音在不同时间到达人们的耳朵,系统必须保留这些延迟和其他空间线索,以便人们仍然能够有意义地感知他们环境中的声音。

在办公室、街道和公园等环境中经过测试,该系统能够提取出汽车响号、鸟鸣、警报和其他目标声音,同时移除所有其他现实世界的噪音。当22名参与者对系统的目标声音音频输出进行评分时,他们表示平均而言,质量较原始录音有所提高。

在某些情况下,系统难以区分具有许多共同特性的声音,如声乐和人类语言。研究人员指出,对模型进行更多现实世界数据的训练可能会改善这些结果。

图片:Canva 、University of Washington

T10

share to wechat

延伸阅读

延伸阅读

乌克兰和平峰会落幕 泽连斯基:俄撤军即和谈 中国非乌敌人

俄6名ISIS囚犯图越狱遭安全部队枪杀 2人质获救

叙利亚内战︱儿童苦中作乐弹坑作泳池 暂忘战火之苦

14名约旦人沙特朝圣时死亡 部分人死于高温 另17人失踪