Mel子带谱质心和高斯混合相关性在鲁棒话者识别中的应用

被引:3
作者
邓菁
郑方
刘建
吴文虎
机构
[1] 清华大学计算机科学与技术系
关键词
Mel; 识别系统; 鲁棒性; 噪音; 特征序列; 谱质心; 噪声; 语音; 高斯混合; 说话人模型; 子带; 相关性;
D O I
10.15949/j.cnki.0371-0025.2006.05.012
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
提出了两种方法以克服背景噪音的干扰并提高说话人识别系统的鲁棒性:一种方法是基于频谱峰值位置受背景噪音影响相对较小的考虑,将子带幅度信息和子带Mel频谱质心(SMSC)相结合;另一种方法是通过计算类转移概率矩阵来对隐藏于高斯混合相关(GMC)中的说话人高层信息进行建模。实验表明SMSC和GMC都能够在平稳噪音环境下提高说话人识别系统的鲁棒性,并且采用SMSC和GMC的GMM-UBM系统跟使用传统MFCC的GMM-UBM基准系统相比,平均错误率下降了11.7%。
引用
收藏
页码:471 / 475
页数:5
相关论文
共 2 条
[1]   几种高鲁棒性通道及说话人自适应语音识别算法研究 [J].
陈景东 ;
姚磊 ;
黄泰翼 .
声学学报, 1998, (06) :537-544
[2]   噪声对特征综合法语音识别性能的影响 [J].
王成友,汤叔祺,梁甸农 .
声学学报, 1997, (03) :282-285