基于高斯混合模型的压缩域语音增强方法

被引:9
作者
梁岩
鲍长春
夏丙寅
何玉文
周璇
李娜
机构
[1] 北京工业大学电子信息与控制工程学院
关键词
语音增强; 参数域; 高斯混合模型; 贝叶斯估计; 非连续性传输; 帧擦除;
D O I
暂无
中图分类号
TN912.35 [语音增强];
学科分类号
0711 ;
摘要
为了有效利用纯净语音导抗谱频率参数(ISFs)的先验知识,本文针对ITU-T G.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利用高斯混合模型拟合其概率密度;然后,在最小均方误差(MMSE)准则下对纯净语音的特征参数进行最优贝叶斯估计.为了兼容编码器中的非连续性传输模式,当处理信号为非语音信息时,算法在保持噪声帧谱包络参数不变的前提下,按固定比例调整对数帧能量;且若出现帧擦除情况,算法不调整接收到的码流,并按正常帧处理方式调整恢复后的参数以更新相关历史.本文采用ITU-T G.160标准进行了性能测试,结果表明,与参考方法相比,所提方法在保证信噪比提高能力的同时,可以达到更大的噪声衰减量,且增强语音的客观质量更优.
引用
收藏
页码:2031 / 2038
页数:8
相关论文
共 2 条
[1]  
宽带音频的非线性频带展宽技术.[D].刘鑫.北京工业大学.2011, 10
[2]  
数字信号处理导论.[M].胡广书编著;.清华大学出版社.2005,