基于神经网络的语音识别研究

被引:0
作者
王伟臻
机构
[1] 浙江大学
关键词
语音识别; 人工神经网络; 特征提取;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着十分广阔的发展前景。一直以来,语音识别研究大部分以线性系统理论为基础,主要包括应矢量量化(VQ)、动态时间规整(DTW)与隐马尔可夫模型(HMM)等技术。然而,人的发音实际上是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性渐渐显示了出来。语音识别技术若要取得突破,就必须引入非线性理论的方法。近年来,人工神经网络(ANN)等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。 本文对语音识别的主要过程进行了详细的介绍。在语音的特征参数提取阶段,本文着重介绍了实际应用中经常使用的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)等。本文主要研究了基于BP神经网络的语音识别,并提出了基于MFCC与LPCC混合参数的语音识别方法,以更好地表现语音的特征,避免传统的分段线性处理所产生的局限性,提高了识别性能。实验结果显示,该方法比传统的MFCC参数的语音识别方法具有更好的识别性能。本文还对识别系统中的BP神经网络进行了优化,改进了性能,缩短了训练时间,为将来移植到嵌入式系统中打下了良好的基础。
引用
收藏
页数:77
共 5 条
[1]
人工神经网络实用教程.[M].杨建刚编著;.浙江大学出版社.2001,
[2]
语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,
[3]
语音识别与理解的研究进展 [J].
江铭虎 ;
朱小燕 ;
袁保宗 .
电路与系统学报, 1999, (02) :53-59
[4]
Review of Neural Networks for Speech Recognition [J].
Lippmann, Richard P. .
NEURAL COMPUTATION, 1989, 1 (01) :1-38
[5]
Speech discrimination by dynamic programming.[J].T. K. Vintsyuk.Cybernetics.1972, 1