隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究

被引:8
作者
张焱
姜惠春
黄志同
机构
[1] 南京理工大学自控系!南京
关键词
隐马尔可夫模型; 语音识别; HMM; DTW; 广义模型; 非特定人; 特定人识别;
D O I
10.15949/j.cnki.0371-0025.1998.06.011
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
提出了广义模型,将动态时间规正(DTW,DynamicTimeWarping)技术和隐马尔可夫模型(HMM,HiddenMarkovModel)统一到一个语音声学模型的框架内.分析表明,广义模型更接近语音实际情况并具有很小的存储量.还利用广义模型构造了汉语全音节语音识别器,和离散HMM及DTW的对比实验结果显示:对于特定人识别,广义模型的识别性能和DTW相当而高于离散HMM;对于非特定人识别,广义模型的识别性能高于DTW和离散HMM。
引用
收藏
页码:555 / 563
页数:9
相关论文
empty
未找到相关数据