基于EM和贝叶斯网络的丢失数据填充算法

被引:19
作者
李宏
阿玛尼
李平
吴敏
机构
[1] 中南大学信息科学与工程学院
关键词
丢失数据填充; 参数更新器; 最大期望值算法(EM); 贝叶斯网络;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
实际应用中存在大量的丢失数据的数据集,对丢失数据的处理已成为目前分类领域的研究热点。分析和比较了几种通用的丢失数据填充算法,并提出一种新的基于EM和贝叶斯网络的丢失数据填充算法。算法利用朴素贝叶斯估计出EM算法初值,然后将EM和贝叶斯网络结合进行迭代确定最终更新器,同时得到填充后的完整数据集。实验结果表明,与经典填充算法相比,新算法具有更高的分类准确率,且节省了大量开销。
引用
收藏
页码:123 / 125
页数:3
相关论文
共 5 条
[1]   On the slow convergence of EM and VBEM in low-noise linear models [J].
Petersen, KB ;
Winther, O ;
Hansen, LK .
NEURAL COMPUTATION, 2005, 17 (09) :1921-1926
[2]   A grey-based nearest neighbor approach for missing attribute value prediction [J].
Huang, CC ;
Lee, HM .
APPLIED INTELLIGENCE, 2004, 20 (03) :239-252
[3]  
AN ANALYSIS OF FOUR MISSING DATA TREATMENT METHODS FOR SUPERVISED LEARNING[J] . Gustavo E. A. P. A. Batista,Maria Carolina Monard.Applied Artificial Intelligence . 2003 (5-6)
[4]   Imputation of missing data in industrial databases [J].
Lakshminarayan, K ;
Harp, SA ;
Samad, T .
APPLIED INTELLIGENCE, 1999, 11 (03) :259-275
[5]  
Imputation using markov chains[J] . Kim-Hung Li.Journal of Statistical Computation and Simulation . 1988 (1)