隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究

被引：8

作者：

张焱

姜惠春

黄志同

机构：

[1] 南京理工大学自控系!南京

来源：

声学学报 | 1998年 / 06期

关键词：

隐马尔可夫模型; 语音识别; HMM; DTW; 广义模型; 非特定人; 特定人识别;

D O I：

10.15949/j.cnki.0371-0025.1998.06.011

中图分类号：

TN912.3 [语音信号处理];

学科分类号：

0711 ;

摘要：

提出了广义模型，将动态时间规正（DTW,DynamicTimeWarping）技术和隐马尔可夫模型（HMM，HiddenMarkovModel）统一到一个语音声学模型的框架内．分析表明，广义模型更接近语音实际情况并具有很小的存储量．还利用广义模型构造了汉语全音节语音识别器，和离散HMM及DTW的对比实验结果显示：对于特定人识别，广义模型的识别性能和DTW相当而高于离散HMM；对于非特定人识别，广义模型的识别性能高于DTW和离散HMM。

引用

页码：555 / 563

页数：9