基于决策树的数据遗失值填充方法的研究

被引:6
作者
郭景峰
米浦波
刘国华
机构
[1] 燕山大学信息科学与工程学院
[2] 燕山大学信息科学与工程学院 河北秦皇岛
[3] 河北秦皇岛
关键词
关联规则; 遗失值; 决策树; 相似度; 填充;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据遗失值填充问题是预处理过程中的一个难点。已有的算法大多寻求数据中属性值之间的关系、属性与属性值之间的关系、属性与属性间的关系来对遗失值进行填充。文章从数据间的关系入手 ,引入相似度的概念 ,并提出一种新的数据遗失值填充算法。这种算法简单 ,易于理解 ,可对一个数据具有多个遗失值的情况进行填充。
引用
收藏
页码:8 / 10
页数:3
相关论文
共 3 条
[1]  
Statistical Analysis with Missing Data,Wiley Series in Probability and Mathematical Statistics. R J A Little,D B Rubin. . 1987
[2]  
Computer-Aided Microbial Identification Using Decision Trees. J Rattary,J D Floros,R H Liton. Food Control . 1999
[3]  
MVC-A Preprocessing Method to Deal with Missing Values. A Ragel,B Crémilleux. Knowledge Based Systems . 1999