多变量缺失数据的不同处理方法及分析结果比较

被引:16
作者
武建虎
贺佳
贺宪民
程红岩
机构
[1] 第二军医大学卫生勤务学系卫生统计学教研室
[2] 东方肝胆外科医院放射科 上海
[3] 上海
关键词
多变量; 缺失值; 多重填补; 肝肿瘤;
D O I
10.16781/j.0258-879x.2004.09.027
中图分类号
R195 [卫生调查与统计];
学科分类号
100401 ;
摘要
目的 :探讨多变量缺失数据的不同处理方法对结果的影响。方法 :分别利用删除含缺失值的观察、简单填补、多重填补 3种方法对多变量中度缺失的 92 5例肝癌患者的临床资料进行统计分析并对其结果进行比较。结果 :不同方法所产生的结果差别较大。在 α=0 .0 5的水平下 ,利用多重填补处理的数据集分析得到影响肝癌患者生存时间的危险因素 :临床分期、肝硬化史、门脉癌栓、g- GT和 WBC;而用删除含缺失值方法得到的却是 :TNM分期、碘油剂量、AST、AL P;简单填补比多重填补多产生 3个危险因素 ,分别是 :TNM分期、AL P和 AFP。结论 :本资料采用删除含缺失值的观察的方法结果最差 ;简单填补相对较好 ,但容易降低标准误、减小 P值 ;而多重填补处理比较合理、科学。建议对多变量数据缺失的处理一定要慎重
引用
收藏
页码:1013 / 1016
页数:4
相关论文
共 2 条
[1]  
医学统计学中的SAS统计分析.[M].贺佳;陆健主编;.第二军医大学出版社.2002,
[2]   居民健康调查资料中的缺失数据的多重估算 [J].
曹阳 ;
Sadana Ritu ;
Tandon Ajay .
中国卫生统计, 2002, (05) :25-27