科研人员提出一种单通道语音信号增强新方法

近日，中国科学院声学研究所噪声与振动院重点实验室助理研究员彭任华等提出一种在线性残差域利用人耳听觉特性约束的单通道语音信号增强滤波器，可显著提高语音质量。

近年来，传声器阵列的应用愈加广泛，但绝大部分低成本设备仍在使用单传声器录音方案。受录音环境噪声和混响等因素影响，单传声器语音信号质量会出现显著下降。

传统的单通道语音信号增强算法，利用谱减算法，通过估计噪声及混响的功率谱密度，与带噪信号相减，实现语音信号增强。声学所该实验室音频研究组曾提出一种广义特征值算法，即在线性残差域利用广义特征值分解方法增强单通道语音信号，并证明了在线性残差域，噪声及晚期混响可以采用相同的算法处理框架。

然而，在低信噪比条件下，谱减算法和广义特征值算法在增强信号过程中均会出现大量可听“音乐噪声”（频率和时间轴上随机出现的短时单频信号），严重影响算法性能。科研人员认为，人耳听觉响应特性曲线在音乐噪声信号抑制方面具有非常大的应用前景。

利用人耳噪声掩蔽曲线指导残留“音乐噪声”的抑制，该研究推导了在线性残差域的噪声掩蔽曲线到广义特征值的映射关系，以及噪声掩蔽曲线约束的最优滤波器，并将该最优滤波器应用于信号增强。

通过比较增强信号的分段信噪比（segmentSNR）、感知语音质量评价（PESQ），以及语音混响调制能量比（SRMR）等客观指标，新算法相比传统算法具有更好的算法性能，MUSHRA（MUltiple Stimuli with Hidden Reference and Anchor）主观测听实验进一步表明了该算法在仿真实验以及实际实验中的有效性。

相关研究成果发表在Speech Communication上。