关于在噪声环境下语音识别优化研究

被引:16
作者
张晓丹
黄丽霞
张雪英
机构
[1] 太原理工大学信息工程学院
关键词
听觉模型; 特征提取; 伽马通滤波器; 鲁棒性;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
在噪声环境下,提取的传统语音特征参数通常会发生改变,导致训练模型和测试语音不匹配,使语音识别系统识别率下降。针对上述问题,提出Gammatone四段式指数压缩特征,能很好地仿真人耳听觉模型处理信号的非线性特性,有较强的鲁棒性。该特征用Gammatone滤波器代替传统的三角滤波器组仿真人耳耳蜗听觉模型,并在三段式指数压缩的基础上对低频段信号进行非线性压缩,更有效地抑制噪声信号。对比实验表明,四段式指数压缩特征的语音识别率明显高于三段式指数压缩的识别率,具有更好的抗噪性能,为语言优化识别提供了参考。
引用
收藏
页码:172 / 176+291 +291
页数:6
相关论文
empty
未找到相关数据