基于HMM模型的汉语数字语音识别算法的研究

被引：0

作者：

马静

机构：

[1] 太原理工大学

关键词：

语音识别; 线性预测倒谱系数; Mel频率倒谱系数; 动态时间规整理论; 隐马尔可夫模型原理;

D O I：

暂无

年度学位：

2008

学位类型：

硕士

导师：

李国勇;

摘要：

语音识别是一门涉及面很广的交叉学科,它是目前发展最为迅速的信息研究领域之一,它与语音学、语言学、数理统计学和神经生理学等学科有非常密切的关系。汉语数字语音识别(mandarin digit speech recognition)的任务是识别“0”到“9”等10个非特定人汉语数字语音。本文着眼于汉语语音识别的主要问题,研究汉语语音识别的关键技术,以提高语音的识别率和识别模型的收敛速度。本文首先对现有的语音识别技术的发展现状进行了分析。在此基础上,介绍了语音识别的基本理论,包括语音信号产生的数学模型和汉语语音特征分析。在语音信号的端点检测方面提出了基于能量和过零率的改进检测方法,并进行了实验仿真和分析。其次详细阐述了线性预测倒谱系数(LPCC)及Mel频率倒谱系数(MFCC)等特征参数的提取方法,结合实验对这两种参数下的识别率进行了比较。实验证明基于MFCC的特征参数比LPCC参数具有更好的识别率。随后介绍了汉语语音识别中常用的方法,动态时间规整(DTW)理论和隐马尔可夫模型(HMM)原理。在对DTW传统方法的分析基础上,本文提出了DTW的高效算法,此高效算法可以减少计算量和存储空间。详细分析了HMM算法的三个基本问题,对实际中Viterbi算法和Baum-Welch算法中存在的下溢问题,分别采用了取对数和定标的方法加以解决。最后利用MATLAB编程实现了基于HMM的汉语数字语音识别系统,比较了HMM用于孤立词和连接词系统的识别率,并与基于DTW的孤立词识别结果作了分析和比较,分别指出了二者的优点和不足,提出了本课题研究未来改进的方向。

引用

页数：85

共 28 条

[1]

汉语数字语音识别技术与实现方法研究 [D].

孙玲 .

华中科技大学,

2004

[2]

基于HMM与自组织神经网络相结合的语音识别 [D].

连晓峰 .

华北工学院,

2004

[3]

State duration modelling in hidden Markov models.[J].S.V. Vaseghi.Signal Processing.1995, 1

[4]

语音信号处理.[M].赵力编著;.机械工业出版社.2003,

[5]

现代语音技术基础与应用.[M].蔡莲红等编著;.清华大学出版社.2003,

[6]

MATLAB扩展编程.[M].何强;何英编著;.清华大学出版社.2002,

[7]

语音信号处理.[M].易克初等编著;.国防工业出版社.2000,

[8]

模式识别.[M].边肇祺等编著;.清华大学出版社.2000,

[9]

语音信号处理.[M].胡航编著;.哈尔滨工业大学出版社.2000,

[10]

语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,

← 1 2 3 →