基于属性重要性的不完备数据填充算法

被引:10
作者
陈志奎
吕爱玲
张清辰
机构
[1] 大连理工大学软件学院
关键词
不完备系统; 数据填充; 马氏距离; 属性约简;
D O I
10.19304/j.cnki.issn1000-7180.2013.07.039
中图分类号
TP315 [管理程序、管理系统];
学科分类号
1201 ;
摘要
现有的不完备数据填充算法对所有缺失数据采用统一方式填充,没有考虑数据的重要性,效率低,实时性差.因此,本文提出一种基于属性重要性的不完全数据填充算法.通过差分矩阵求得属性约简,根据约简区分重要属性和非重要属性,对于重要属性数据填充采用改进的马氏距离填充方法,而不重要属性数据填充采用相似度概率填充方法,保证了数据精确度的同时,提高了实时性,具有实用性.最后,实验部分采用数据家庭系统数据和UCI标准数据集分别对算法性能进行了分析,验证了该算法的优越性.
引用
收藏
页码:167 / 172+176 +176
页数:7
相关论文
共 5 条
[1]   一种快速差别矩阵属性约简算法 [J].
吕萍 ;
钱进 ;
王波 ;
谢峰 .
计算机工程与应用 , 2010, (20) :164-167+201
[2]   基于马氏距离的缺失数据填充算法 [J].
刘星毅 ;
檀大耀 ;
曾春华 ;
韦小铃 .
微计算机信息, 2010, 26 (09) :225-226+215
[3]   基于EM和贝叶斯网络的丢失数据填充算法 [J].
李宏 ;
阿玛尼 ;
李平 ;
吴敏 .
计算机工程与应用 , 2010, (05) :123-125
[4]   几种不同缺失值填充方法的比较 [J].
刘星毅 ;
农国才 .
南宁师范高等专科学校学报, 2007, (03) :148-150
[5]   基于马氏距离的缺失值填充算法 [J].
杨涛 ;
骆嘉伟 ;
王艳 ;
吴君浩 .
计算机应用, 2005, (12) :152-155