基于R软件的缺失数据MICE填补效果研究

被引:20
作者
章涛
朱麟
季加东
袁中尚
薛付忠
李秀君
机构
[1] 山东大学公共卫生学院流行病与卫生统计学系
关键词
MICE; 缺失数据; 模拟研究; 多重填补;
D O I
暂无
中图分类号
R195.1 [卫生统计学];
学科分类号
100401 [流行病与卫生统计学];
摘要
目的研究不同缺失率、不同缺失机制下,MICE(multivariate imputation by chained equations)多重填补的效果,探讨该填补方法的适用情况。方法依托某现况调查的完全数据,使用R软件构造不同缺失率、不同缺失机制的缺失数据。计算列表删除和MICE多重填补后分析结果的标准偏倚,并进行比较。单独对分类变量计算多重填补后的平均错分率。结果在单变量缺失率分别为10%、20%和30%的随机缺失三种情况下,MICE多重填补表现优良;其他模拟情况下,MICE多重填补相比于列表删除并未表现出明显的优势。对于分类变量,MICE填补后的平均错分率均超过60%。结论对于随机缺失数据,且单变量缺失率不超过30%时,建议采用MICE多重填补进行处理;但对于资料中的分类变量,不建议直接引用MICE填补后的具体数值。
引用
收藏
页码:580 / 584
页数:5
相关论文
共 12 条
[1]
任意缺失模式缺失数据不同填补方法效果比较 [J].
张桥 ;
李宁 ;
张秋菊 ;
刘美娜 .
中国卫生统计, 2013, 30 (05) :690-692
[2]
数据非随机缺失机制的混合效应模式混合模型分析与应用 [J].
季家超 ;
王刚 ;
张潇雅 ;
刘桂芬 .
中国卫生统计, 2013, (02) :221-225
[3]
缺失数据统计处理方法的研究进展 [J].
帅平 ;
李晓松 ;
周晓华 ;
刘玉萍 .
中国卫生统计, 2013, (01) :135-139+142
[4]
成组删除法和多重填补法对随机缺失的二分类变量资料处理效果的比较 [J].
王曼 ;
施念 ;
花琳琳 ;
杨永利 .
郑州大学学报(医学版), 2012, 47 (05) :642-645
[5]
基于R语言的缺失值填补方法 [J].
李璐 .
统计与决策, 2012, (17) :72-74
[6]
纵向监测连续非随机缺失数据变系数模型及其应用 [J].
徐丽红 ;
刘志永 ;
刘桂芬 ;
罗天娥 .
中国卫生统计 , 2012, (03) :314-317
[7]
缺失数据处理方法的比较研究 [J].
刘鹏 ;
雷蕾 ;
张雪凤 .
计算机科学, 2004, (10) :155-156+174
[8]
多变量缺失数据的不同处理方法及分析结果比较 [J].
武建虎 ;
贺佳 ;
贺宪民 ;
程红岩 .
第二军医大学学报, 2004, (09) :1013-1016
[9]
不同缺失机制并存时偏倚校正的模拟研究 [D]. 
赵俊康 .
山西医科大学,
2012
[10]
缺失值处理统计方法的模拟比较研究及应用 [D]. 
茅群霞 .
四川大学,
2005