语音识别(Speech Recognition)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术以语音信号处理为研究对象,涉及语言学、计算机科学、信号处理、生理学、心理学等诸多领域,是模式识别的重要分支。该技术有非常广阔的应用前景。而目前应用最为成功的语音识别系统大多是基于隐马尔可夫模型(Hidden Markov Model)的识别系统,所以深入了解和掌握隐马尔可夫模型(HMM)是十分有意义的。
论文主要研究语音识别的基本原理和不同的识别算法,并着重研究隐马尔可夫模型(HMM)和基于此模型的语音识别算法。在此基础上论文构建了一个基于隐马尔可夫模型(HMM)的孤立词语音识别系统。该系统完成了语音识别的主要过程,包含预处理、端点检测、特征参数提取和模式匹配。预处理主要进行了预加重和加窗分帧,端点检测采用了双门限方法,特征参数提取采用的是线性预测分析方法,选取了美尔倒谱系数(MFCC)作为主要的特征参数,利用隐马尔科夫模型(HMM)完成了汉语语音“0”-“9”的训练和识别。多人实验的结果表明,该系统的识别率达到90%左右,可以满足系统的设计要求。论文最后,还针对HMM和DTW(动态时间规整)两种不同的训练和识别算法作了一个仿真实验,对比二者的识别率可以发现,删实验的结果要明显优于DTW。HMM虽然在训练时要耗费较多时间,但是识别速度较高,充分反映了HMM的优势。