混响声场中语音识别方法研究

被引：10

作者：

栗学丽

徐柏龄

机构：

[1] 南京大学声学所近代声学国家重点实验室

[2] 南京大学声学所近代声学国家重点实验室南京

[3] 南京

来源：

南京大学学报(自然科学版) | 2003年 / 04期

关键词：

混响声场; 语音识别; 滤波规整的Mel频率倒谱参数; 矢量量化;

D O I：

暂无

中图分类号：

TN912.3 [语音信号处理];

学科分类号：

0711 ;

摘要：

免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7％。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。

引用

页码：525 / 531

页数：7