噪声鲁棒性说话人识别语音高频加权MFCC提取

被引:15
作者
陈迪 [1 ]
龚卫国 [1 ]
李波 [2 ]
机构
[1] 重庆大学光电技术及系统教育部重点实验室
[2] 重庆大学现代物理中心材料科学与工程博士后流动站
关键词
高频加权; 说话人确认; 基音同步; 鲁棒性; MFCC;
D O I
10.19650/j.cnki.cjsi.2008.03.043
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而保留更多高次谐波信息。将语音频谱能量高频部分进行加权,则可使语音增强,提高语音鲁棒性。该方法被用于基音同步预处理MFCC参数提取中,并进行了说话人确认实验。实验结果表明,即使在信噪比较低的情况下,该方法都会在一定程度上提高多种噪声环境下的说话人确认识别率。
引用
收藏
页码:668 / 672
页数:5
相关论文
empty
未找到相关数据