基于神经网络的语音识别研究

被引：0

作者：

王伟臻

机构：

[1] 浙江大学

关键词：

语音识别; 人工神经网络; 特征提取;

D O I：

暂无

年度学位：

2008

学位类型：

硕士

导师：

杨建刚;

摘要：

语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着十分广阔的发展前景。一直以来,语音识别研究大部分以线性系统理论为基础,主要包括应矢量量化(VQ)、动态时间规整(DTW)与隐马尔可夫模型(HMM)等技术。然而,人的发音实际上是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性渐渐显示了出来。语音识别技术若要取得突破,就必须引入非线性理论的方法。近年来,人工神经网络(ANN)等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。本文对语音识别的主要过程进行了详细的介绍。在语音的特征参数提取阶段,本文着重介绍了实际应用中经常使用的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)等。本文主要研究了基于BP神经网络的语音识别,并提出了基于MFCC与LPCC混合参数的语音识别方法,以更好地表现语音的特征,避免传统的分段线性处理所产生的局限性,提高了识别性能。实验结果显示,该方法比传统的MFCC参数的语音识别方法具有更好的识别性能。本文还对识别系统中的BP神经网络进行了优化,改进了性能,缩短了训练时间,为将来移植到嵌入式系统中打下了良好的基础。

引用

页数：77

共 5 条

[1]

人工神经网络实用教程.[M].杨建刚编著;.浙江大学出版社.2001,

[2]

语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,

[3]

语音识别与理解的研究进展 [J].