缺失值处理方法比较研究

被引:17
作者
胡红晓 [1 ]
谢佳 [2 ]
韩冰 [2 ]
机构
[1] 河北医科大学图书馆
[2] 西南财经大学统计学院
关键词
缺失值; 插补; 多重插补;
D O I
暂无
中图分类号
TP301 [理论、方法];
学科分类号
081202 ;
摘要
在数据收集过程中,由于各种原因可能造成数据集包括有噪声、不完整,甚至不一致的数据。这些问题将严重影响数据挖掘的质量和结果的稳健性,因此,对数据挖掘的对象进行预处理就显得尤为重要。数据的预处理分为数据清洗、数据集成、数据转换和数据消减。缺失值的处理是数据的清洗的第一步。对缺失值的处理有多种方法,本文将主要分析多重插补的方法。
引用
收藏
页码:352 / 353
页数:2
相关论文
empty
未找到相关数据