共 2 条
Mel子带谱质心和高斯混合相关性在鲁棒话者识别中的应用
被引:3
作者:
邓菁
郑方
刘建
吴文虎
机构:
[1] 清华大学计算机科学与技术系
来源:
关键词:
Mel;
识别系统;
鲁棒性;
噪音;
特征序列;
谱质心;
噪声;
语音;
高斯混合;
说话人模型;
子带;
相关性;
D O I:
10.15949/j.cnki.0371-0025.2006.05.012
中图分类号:
TN912.34 [语音识别与设备];
学科分类号:
摘要:
提出了两种方法以克服背景噪音的干扰并提高说话人识别系统的鲁棒性:一种方法是基于频谱峰值位置受背景噪音影响相对较小的考虑,将子带幅度信息和子带Mel频谱质心(SMSC)相结合;另一种方法是通过计算类转移概率矩阵来对隐藏于高斯混合相关(GMC)中的说话人高层信息进行建模。实验表明SMSC和GMC都能够在平稳噪音环境下提高说话人识别系统的鲁棒性,并且采用SMSC和GMC的GMM-UBM系统跟使用传统MFCC的GMM-UBM基准系统相比,平均错误率下降了11.7%。
引用
收藏
页码:471 / 475
页数:5
相关论文