隐马氏模型距离的理论与应用

被引:0
作者
谢锋
机构
[1] 国防科学技术大学
关键词
隐马氏模型; 前向-后向算法; Baum-Welch算法; Viterbi算法; Kullback-Leibler距离; Juang-Rabiner距离;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
隐马氏模型(the Hidden Markov Models,简称HMM)作为一种统计模型,是由L.E.Baum和T.Petrie等人在上个世纪六十年代末七十年代初发展起来的。随后,它逐渐被应用到多个领域,如语音识别、基因关联分析和基因识别、文字识别、图象处理、目标跟踪和信号处理等。HMM理论主要包括三大问题:学习问题、识别问题和解码问题,其中学习问题(也称参数估计问题)是核心问题。本文主要讨论与HMM的参数估计和聚类问题密切相关的HMM距离的理论及其应用。 在参数估计问题中常常要用Baum-Welch重估计算法来优化参数。从理论上讲,每经过一次迭代,参数都得到优化,但实际上不可能无休止地计算下去,那么迭代到什么时候停止呢?这就需要定义一个距离来控制重估计的进程。同样,在HMM的聚类问题中也需要定义一个距离来进行模型分类。以前的文献提出了各种有意义的距离(如文献[1—10]),然而并没有一个规范的定义。最常用的是Juang和Rabiner在文献[2]中提出的距离(简称J-R距离),目前多数文献采用该距离或对其进行一些小的修改。但该距离存在两个明显缺点:一是采用蒙特卡洛方法来计算,其结果具有不确定性;二是收敛速度慢,计算量大,基至难以从数值上计算。本文在总结以前有关HMM距离的文献的基础上(其中还将Juang和Rabiner的一些直观论述加以严格的证明),从两个方向入手对HMM的距离进行了研究:一是寻求更快速有效的近似算法,二是引入一个新的更实用的距离。 本文的创新有以下几点: 1 对J-R距离的理论进行了完善,并用信息论中的相对熵对该距离作出了新的解释。 2 针对J-R距离在理论上很有意义,但实际上难以计算且结果具有不确定性的缺点,利用文献[11],得到了近似计算离散HMM和具有混合高斯观测密度的连续HMM距离的一种快速有效的算法,该算法用矩阵形式来表达,便于用MATLAB进行计算。 3 在给出并证明了离散HMM转化为齐次马氏链的一个定理的基础上,利用文献[12]研究动态聚类问题时所提出的马氏链之间的距离,定义了一个新的离散HMM的距离。与J-R距离相比,新距离是一个确定值且易于计算,最后经仿真实验表明该距离是合适的。
引用
收藏
页数:67
共 9 条
[1]
一种基于Markov链模型的动态聚类方法 [J].
邢永康 ;
马少平 .
计算机研究与发展, 2003, (02) :129-135
[2]
非齐次语音识别HMM模型和THED语音识别与理解系统 [J].
王作英 .
电信科学, 1993, (04) :31-36
[3]
基于KL鉴别信息的语音识别粗分类 [J].
战普明 ;
陆大jin ;
王作英 .
电子学报, 1993, (04) :1-6
[4]
用KL鉴别信息作为语音识别距离测度的研究 [J].
战普明 ;
陆大 ;
王作英 .
电子学报, 1993, (01) :1-7
[5]
Exponential forgetting and geometric ergodicity in hidden Markov models [J].
Le Gland, F ;
Mevel, L .
MATHEMATICS OF CONTROL SIGNALS AND SYSTEMS, 2000, 13 (01) :63-93
[6]
语音信号处理.[M].易克初等编著;.国防工业出版社.2000,
[7]
随机过程通论.[M].王梓坤 著.北京师范大学出版社.1996,
[8]
随机过程理论与应用.[M].熊大国编著;.国防工业出版社.1991,
[9]
随机过程教程.[M].李漳南;吴荣 编.高等教育出版社.1987,