语音识别算法的研究

被引:0
作者
张卫清
机构
[1] 南京理工大学
关键词
语音识别; 动态时间弯折; 隐式马尔可夫模型; 线性预测编码; Mel频率倒谱系数; 随机分段模型;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
本文对语音识别中常用的一些算法进行了改进和验证,具体工作如下: 首先对语音信号的预处理和特征提取问题进行了讨论,提取了三个有效的语音识别特征参数——LPC系数、LPC倒谱系数和Mel频率倒谱系数(MFCC);其次着重讨论了语音识别中常用的两种识别方法——基于模板匹配的DTW和基于统计模型的HMM在语音识别中的应用,分别讨论了各自的模型训练和识别的方法,对HMM在实际应用中的一些具体问题也进行了讨论;最后对常规HMM提出了一些改进方法,包括显式状态驻留和随机分段模型(SM),重点讨论了SM在语音识别中的训练和识别方法,并通过一个孤立数字语音识别系统验证了其比常规HMM更能描述语音信号的特征。
引用
收藏
页数:67
共 9 条
[1]
语音信号处理.[M].赵力编著;.机械工业出版社.2003,
[2]
语音信号处理.[M].易克初等编著;.国防工业出版社.2000,
[3]
语音信号处理.[M].胡航编著;.哈尔滨工业大学出版社.2000,
[4]
语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,
[5]
语音信号数字处理.[M].[美]拉宾纳(L·R·Rabiner);[美]谢弗(R·W·Schafer) 著;朱雪龙 译.科学出版社.1983,
[6]
汉语数码语音识别:发展现状、难点分析与方法比较 [J].
顾良 ;
刘润生 .
电路与系统学报, 1997, (04)
[7]
连接数字语音识别 [J].
张春涛 ;
吴善培 .
北京邮电大学学报, 1997, (04)
[8]
基于分段模糊c-均值的连续密度HMM语音识别模型参数估计 [J].
马小辉 ;
富煜清 ;
陆佶人 .
声学学报, 1997, (06) :550-554
[9]
语音识别隐马尔可夫模型的改进 [J].
战普明 ;
王作英 ;
陆大 .
电子学报, 1994, (01)