共 2 条
混响声场中语音识别方法研究
被引:10
作者:
栗学丽
徐柏龄
机构:
[1] 南京大学声学所近代声学国家重点实验室
[2] 南京大学声学所近代声学国家重点实验室 南京
[3] 南京
来源:
关键词:
混响声场;
语音识别;
滤波规整的Mel频率倒谱参数;
矢量量化;
D O I:
暂无
中图分类号:
TN912.3 [语音信号处理];
学科分类号:
0711 ;
摘要:
免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。
引用
收藏
页码:525 / 531
页数:7
相关论文