基于双高斯GMM的特征参数规整及其在语音识别中的应用

被引:4
作者
刘波
戴礼荣
王仁华
杜俊
李锦宇
机构
[1] 中国科学技术大学电子工程与信息科学系
基金
国家高技术研究发展计划(863计划);
关键词
语音识别; 前端; 噪声鲁棒性; 语音特征参数规整; 直方图均衡;
D O I
10.16383/j.aas.2006.04.006
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
对特征参数概率分布的实验分析表明,在有噪声影响的情况下,特征参数通常呈现双峰分布.据此,本文提出了一种新的,基于双高斯的高斯混合模型(Gaussian mixture model,GMM)的特征参数归一化方法,以提高语音识别系统的鲁棒性.该方法采用更为细致的双高斯模型来表达特征参数的累积分布函数(CDF),并依据估计得到的CDF进行参数变换将训练和识别时的特征参数的分布都规整为标准高斯分布,从而提高识别正确率.在Aurora 2和Aurora 3数据库上的实验结果表明,本文提出的方法的性能明显好于传统的倒谱均值规整(Cepstral mean normalization,CMN)和倒谱均值方差规整(Cepstral mean and variance normalization,CMVN)方法,而与非参数化方法一直方图均衡特征规整方法的性能基本相当.
引用
收藏
页码:519 / 525
页数:7
相关论文
empty
未找到相关数据