混响声场中语音识别方法研究

被引:10
作者
栗学丽
徐柏龄
机构
[1] 南京大学声学所近代声学国家重点实验室
[2] 南京大学声学所近代声学国家重点实验室 南京
[3] 南京
关键词
混响声场; 语音识别; 滤波规整的Mel频率倒谱参数; 矢量量化;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。
引用
收藏
页码:525 / 531
页数:7
相关论文
共 2 条
[1]   无参考输入的双话筒噪声抵消(英文) [J].
方元 ;
徐柏龄 .
南京大学学报(自然科学版), 2002, (01) :59-63
[2]   基于MFCCs滤波的电话语音识别的通道补偿方法 [J].
韩纪庆 ;
高文 .
计算机学报, 1998, (12) :0-0+0