基于连续高斯混合密度HMM的汉语全音节语音识别研究

被引:12
作者
国立新,莫福源,李昌立
机构
[1] 中国科学院声学研究所
关键词
语音识别; 倒谱; 回归系数; 高斯混合密度; 算法; HMM; 汉语声母;
D O I
10.15949/j.cnki.0371-0025.1995.05.001
中图分类号
O42 [声学];
学科分类号
070206 ; 082403 ;
摘要
本文在大量语音分析实验的基础上,对HMM用于汉语全音节语音识别进行了较为深入的探讨,建立了一个连续高斯混合密度HMM的汉语全音节语音识别系统.该系统在训练算法上撇开了传统的Baum-Welch算法,代之以计算复杂度小、存储量小、迭代次数少且具有自动分割效应的分段K平均算法。对于HMM的模型单元的选择,单元的结构以及模型参数的选取,充分考虑了汉语语音的特点;并在语音特征上做了深入的实验分析工作,采用了符合人耳听觉特性的Mel-Scaled参数,用FFT倒谱代替了LPC倒谱,同时利用了语音的动态谱特征和能量特征。另外,本文还针对汉语声母的特点,独特地提出了变帧移分析策略。整个识别系统的首选正识率为91.1%.
引用
收藏
页码:321 / 329
页数:9
相关论文
共 2 条
[1]   汉语孤立字全音节实时识别系统 [J].
陈韬 ;
李昌立 ;
莫福源 .
声学学报, 1993, (03) :161-171
[2]   汉语普通话辅音音长分析 [J].
齐士钤 ;
张家騄 .
声学学报, 1982, (01) :8-13