基于聚类分析的缺失数据最近邻填补算法

被引:40
作者
张赤 [1 ,2 ]
丰洪才 [1 ]
金凯 [2 ]
杨婷 [2 ]
机构
[1] 武汉工业学院数学与计算机学院
[2] 中国农业银行湖北省分行营业部电子银行部
关键词
灰色关联; 马氏距离; 聚类分析; 最近邻算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
数据缺失在各个研究领域中普遍存在,缺失的数据会对计算的性能与结果产生严重的影响。为提高填补缺失数据的准确度,提出一种基于聚类分析的缺失数据最近邻填补算法。该算法在对数据聚类分析后根据类别分配权重,在MGNN(MahalanobisGray and Nearest Neighbor)算法的基础上改进了计算方法和填充值的计算方式。实验结果表明,该方法填补的准确度比传统KNN和MGNN算法要高。
引用
收藏
页码:282 / 284
页数:3
相关论文
共 10 条
[1]
经济预测方法.[M].孙文生;杨汭华主编;.中国农业大学出版社.2005,
[2]
A grey-based nearest neighbor approach for missing attribute value prediction [J].
Huang, CC ;
Lee, HM .
APPLIED INTELLIGENCE, 2004, 20 (03) :239-252
[3]
Imputation of missing data in industrial databases [J].
Lakshminarayan, K ;
Harp, SA ;
Samad, T .
APPLIED INTELLIGENCE, 1999, 11 (03) :259-275
[4]
聚类分析与模糊评判结合的入侵检测算法 [J].
翟光群 ;
王永生 .
计算机工程与应用, 2012, 48 (21) :99-102+122
[5]
一种基于KNN的文本分类算法 [J].
余悦蒙 ;
黄小斌 .
电脑知识与技术, 2012, 8 (07) :1564-1566
[6]
基于马氏距离的缺失数据填充算法 [J].
刘星毅 ;
檀大耀 ;
曾春华 ;
韦小铃 .
微计算机信息, 2010, 26 (09) :225-226+215
[7]
基于马氏距离和灰色分析的缺失值填充算法 [J].
刘星毅 .
计算机应用, 2009, 29 (09) :2502-2504+2536
[8]
基于灰色关联分析的缺失值重复填补方法 [J].
苏毅娟 .
计算机工程与应用 , 2009, (15) :169-172
[9]
缺失数据的处理和挑战 [J].
刘星毅 ;
曾春华 ;
江南雨 ;
陈振华 ;
韦小玲 .
钦州学院学报, 2008, 23 (06) :25-29
[10]
几种不同缺失值填充方法的比较 [J].
刘星毅 ;
农国才 .
南宁师范高等专科学校学报, 2007, (03) :148-150