不同缺失机制并存时偏倚校正的模拟研究

被引:0
作者
赵俊康
机构
[1] 山西医科大学
关键词
选择性偏倚; 随机缺失; 多重填补; 样本选择模型; 两阶段校正方法;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
目的:本研究主要针对以往医疗费用调查中的因变量数据既存在应就医而因贫困等原因未就医导致的0截取或选择性偏倚问题,又存在随机的无应答造成的因变量缺失现象,提出了针对这两类重要的无应答偏倚机制并存时的两阶段校正方法,从而为正确估计相对弱势的人群的医疗费用及其影响因素提供方法学依据。 方法:通过统计模拟得出不同程度随机缺失和非随机缺失并存时的多个数据集。首先利用非缺失数据(不包括含有非随机缺失数据的个体观测值)对单纯无应答按照随机缺失(MAR)机制通过预测均数匹配法(PMM)、倾向性得分法(PS)、基于Bootstrap的EM算法(EMB)和马尔科夫链蒙特卡洛算法(MCMC)四种填补方法进行多重填补(第一阶段);在此基础上对选择性偏倚造成的缺失数据进行样本选择模型拟合以校正数据非随机缺失造成的偏倚(第二阶段);最后对多个样本选择模型拟合结果进行合并。对模拟出的结果以标准偏倚、均方误差的平方根和可信区间平均长度作为评价填补方法优劣的标准。 结果:通过模拟研究发现随着随机和非随机缺失率的增加,各项标准的值均不同程度的增加,说明填补方法准确度和精确度也在逐渐降低。在任意一种缺失情况下,由于PS法的标准偏倚绝对值超过了规定的界值,故该法不可取;而PMM、EMB和MCMC法均得出较好的结果。当非随机缺失为轻度时,不同程度随机缺失情况下的填补方法选择为:在随机缺失也为轻度时,MCMC法最好;在随机缺失为中度时,EMB法最好;在随机缺失为重度时,PMM法最好。当非随机缺失为中度时,无论随机缺失程度如何,MCMC都是最好的方法;当非随机缺失为重度时,无论随机缺失程度如何,PMM都是最好的方法。 结论:PMM、EMB和MCMC法均是处理随机缺失较好的填补方法,可以根据本次研究的模拟结果有选择的将填补方法运用于各种不同缺失情况的实际调查,其预期结果也能为同类调查研究中针对这两类缺失并存时的数据填补提供统计方法学上的依据。
引用
收藏
页数:37
共 13 条
[1]
医保、农保患者住院医疗费用影响因素分析 [J].
祖学亮 ;
李新华 ;
朱宇飞 ;
袁鸿绯 .
中国卫生统计, 2009, (03) :278-281
[2]
样本选择模型的似然估计与两步估计 [J].
张磊 ;
王彤 ;
王琳娜 .
现代预防医学, 2007, (09) :1607-1609
[3]
受限因变量模型及其半参数估计 [J].
薛小平 ;
史东平 ;
王彤 .
中国卫生统计, 2007, (02) :211-213
[4]
What to Do about Missing Values in Time-Series Cross-Section Data [J].
Honaker, James ;
King, Gary .
AMERICAN JOURNAL OF POLITICAL SCIENCE, 2010, 54 (02) :561-581
[5]
Not All Survey Effort is Equal.[J].Andy Peytchev;Rodney K. Baxter;Lisa R. Carley Baxter.Public Opinion Quarterly.2009, 4
[6]
Imputations of missing values in practice: Results from imputations of serum cholesterol in 28 cohort studies [J].
Barzi, F ;
Woodward, M .
AMERICAN JOURNAL OF EPIDEMIOLOGY, 2004, 160 (01) :34-45
[7]
Testing and correcting for non-random selection bias due to censoring: An application to medical costs [J].
Onur Başer ;
Cathy J. Bradley ;
Joseph C. Gardiner ;
Charles Given .
Health Services and Outcomes Research Methodology, 2003, 4 (2) :93-107
[8]
On the impact of bootstrap in survey sampling and small-area estimation [J].
Lahiri, R .
STATISTICAL SCIENCE, 2003, 18 (02) :199-210
[9]
Multiple Imputation in Practice.[J].Nicholas J Horton;Stuart R Lipsitz.The American Statistician.2001, 3
[10]
A test of missing completely at random for generalised estimating equations with missing data.[J].HY Chen;R Little.Biometrika.1999,