成组删除法和多重填补法对随机缺失的二分类变量资料处理效果的比较

被引:14
作者
王曼 [1 ]
施念 [2 ]
花琳琳 [3 ]
杨永利 [4 ]
机构
[1] 郑州大学学报编辑部
[2] 郑州大学临床医学系
[3] 郑州大学第二附属医院科研外事办公室
[4] 郑州大学公共卫生学院卫生统计学教研室
基金
国家科技攻关计划;
关键词
二分类变量; 缺失值; 成组删除法; 多重填补法;
D O I
暂无
中图分类号
R195.1 [卫生统计学];
学科分类号
100401 [流行病与卫生统计学];
摘要
目的:评价两种随机缺失的二分类变量资料处理方法。方法:以艾滋病中医症候的调查资料为数据来源,利用SAS9.2对完整数据集随机模拟,构建不同比例的随机缺失数据集,对缺失数据集采用多重填补法中的lo-gistic回归法(MI/logistic)进行填充处理;同时对缺失数据集采用成组删除法进行处理;根据各个数据集建立logis-tic回归模型,与完整数据集进行比较。结果:缺失10%时,成组删除法处理结果与完整数据集更接近;缺失20%~40%时,MI/logistic填补后常数项和x的回归系数明显偏离完整数据集;缺失50%时,MI/logistic填充2次时x的回归系数和标准误更接近于完整数据集;缺失60%时,MI/logistic填充后x的回归系数严重偏离完整数据集,成组删除后x回归系数的标准误明显偏离完整数据集。结论:缺失较少(缺失率<40%)时,成组删除法处理效果较好;缺失50%时,采用MI/logistic回归法填充效果更好;缺失60%以上时,两处理方法均不理想。
引用
收藏
页码:642 / 645
页数:4
相关论文
共 5 条
[1]
缺失值处理统计方法的模拟比较研究及应用 [D]. 
茅群霞 .
四川大学,
2005
[2]
不同缺失值处理方法对随机缺失数据处理效果的比较 [J].
花琳琳 ;
施念 ;
杨永利 ;
赵天仪 ;
施学忠 .
郑州大学学报(医学版), 2012, 47 (03) :315-318
[3]
期望最大化法和回归法对亚洲心血管病国际合作研究缺失数据填充效果比较 [J].
杨永利 ;
付鹏钰 ;
胡东生 ;
张卫东 ;
张梅喜 ;
王重建 ;
平智广 .
中国卫生统计, 2009, 26 (04) :367-369+373
[4]
SAS中处理数据集缺失值方法的对比研究 [J].
殷杰 ;
石锐 .
计算机应用, 2007, (S1) :438-439
[5]
居民健康调查资料中的缺失数据的多重估算 [J].
曹阳 ;
Sadana Ritu ;
Tandon Ajay .
中国卫生统计, 2002, (05)