基于连续高斯混合密度HMM的汉语全音节语音识别研究

被引：12

作者：

国立新，莫福源，李昌立

机构：

[1] 中国科学院声学研究所

来源：

声学学报 | 1995年 / 05期

关键词：

语音识别; 倒谱; 回归系数; 高斯混合密度; 算法; HMM; 汉语声母;

D O I：

10.15949/j.cnki.0371-0025.1995.05.001

中图分类号：

O42 [声学];

学科分类号：

070206 ; 082403 ;

摘要：

本文在大量语音分析实验的基础上，对ＨＭＭ用于汉语全音节语音识别进行了较为深入的探讨，建立了一个连续高斯混合密度ＨＭＭ的汉语全音节语音识别系统．该系统在训练算法上撇开了传统的Ｂａｕｍ－Ｗｅｌｃｈ算法，代之以计算复杂度小、存储量小、迭代次数少且具有自动分割效应的分段Ｋ平均算法。对于ＨＭＭ的模型单元的选择，单元的结构以及模型参数的选取，充分考虑了汉语语音的特点；并在语音特征上做了深入的实验分析工作，采用了符合人耳听觉特性的Ｍｅｌ－Ｓｃａｌｅｄ参数，用ＦＦＴ倒谱代替了ＬＰＣ倒谱，同时利用了语音的动态谱特征和能量特征。另外，本文还针对汉语声母的特点，独特地提出了变帧移分析策略。整个识别系统的首选正识率为９１．１％．

引用

页码：321 / 329

页数：9