EM算法及其应用

被引:0
作者
张宏东
机构
[1] 山东大学
关键词
EM算法; 缺失数据; 极大似然估计; Monte Carlo; 混合高斯模型; Baum-Welch算法;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
EM (expectation-maximization)算法又称期望最大化算法,是Dempster, Laind, Rubin于1977年提出的求参数极大似然估计的一种迭代优化策略,它可以从非完整数据集中对参数进行极大似然估计,是一种非常简单实用的学习算法。这种方法可以广泛地应用于处理缺损数据,截尾数据,带有噪声等所谓的不完全数据,EM算法是在缺失数据等不完全数据下进行参数的极大似然估计或者极大后验估计一种行之有效的方法。 文章的首先主要介绍来了EM算法的研究背景意义,国内外研究现状,以及EM算法优化迭代的理论和一般步骤,接着给出了一个启发性的例子从而让我们更好的理解EM算法,接着对EM算法的收敛性进行了证明,说明了EM算法每次迭代总是能提高似然函数值直到收敛到一个稳定点,之后研究了EM算法的收敛速度。 从上一部分可以看出,EM算法的优势是显然的,基于其简单、收敛、稳定上升,但是它也有诸多缺点,本文之后阐述了针对EM算法的缺点对其进行的各方面改进,包括改进E步的Monte Carlo EM算法原理、迭代的一般步骤;改进M步的ECM、ECME算法的理论、算法及其收敛速度分析,以及针对EM算法收敛速度慢的加速方法和PX-EM算法; 文章的最后一部分给出了EM算法的三个非常重要的应用,包括EM算法在二元正态分布上的参数估计的应用、混合高斯分布参数估计方面的应用以及EM算法在隐马尔科夫模型(HMM)参数估计方面的应用,即著名的Baum-Welch算法,一种EM算法的特例。最后用编程实现算法,得到的参数估计结果还是比较理想的。 综合本文对EM算法的研究,可以看出EM算法在处理数据缺失问题中有明显优势,算法和原理简单,收敛稳定,应用广泛。当然如本文第四章所说,EM算法也存在诸多缺点(比如收敛速度慢:E步、M步计算困难)等,但是相信随着更多的学者对EM算法进行深入的研究,EM算法会得到更大的推广和改进,这些问题也都会逐步得到解决。
引用
收藏
页数:59
共 17 条
[1]
Monte Carlo EM梯度法在MATLAB中的实现 [J].
王紫虹 ;
黄沛琛 .
统计与决策, 2012, (17) :24-27
[2]
缺失数据下多元正态模型Monte Carlo EM算法 [J].
王继霞 ;
刘次华 .
郑州大学学报(理学版), 2011, 43 (03) :59-61
[3]
EM算法理论及其应用 [J].
杨基栋 .
安庆师范学院学报(自然科学版), 2009, 15 (04) :30-35
[4]
EM算法研究与应用 [J].
王爱平 ;
张功营 ;
刘方 .
计算机技术与发展, 2009, 19 (09) :108-110
[5]
基于EM算法约束条件下参数的估计 [J].
孟丽新 ;
刘洪 .
东北师大学报(自然科学版), 2008, 40 (04) :28-32
[6]
EM算法在不完全数据参数估计中的应用 [J].
茹正亮 ;
高安力 .
南京工程学院学报(自然科学版), 2008, 6 (04) :9-12
[7]
Monte Carlo EM加速算法 [J].
罗季 .
应用概率统计, 2008, (03) :312-318
[8]
高斯混合模型聚类中EM算法及初始化的研究 [J].
岳佳 ;
王士同 .
微计算机信息, 2006, (33) :244-246+302
[9]
基于EM算法的极大似然参数估计探讨 [J].
孙大飞 ;
陈志国 ;
刘文举 .
河南大学学报(自然科学版), 2002, (04) :35-41
[10]
基于EM算法的含缺失数据的参数估计 [D]. 
陈婷 .
大连理工大学,
2008