数据缺失机制及其检验

被引:0
作者
孙晓松
机构
[1] 苏州大学
关键词
缺失机制; EM算法; Bayesian估计; log it模型;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
现实中常存在具有缺失数据时的参数估计或统计推断问题,对这类问题的处理往往是一件复杂工作,既牵涉到统计推断问题,又涉及到缺失数据产生的机制问题。目前的常规处理中,常假定数据的缺失是随机缺失或完全随机缺失,而不考虑非随机缺失的情形。但这种假定是否成立,则不得而知。本文采用了一种模拟方法对数据缺失机制的检验作了初步研究。 本文首先介绍了缺失机制的概念及其概率表示形式,并介绍了logit模型的发展背景;其次在线性回归模型中,分别在MAR和NMAR两种机制下进行了参数估计,结果表明,不同的缺失机制对参数的估计是有影响的。这说明在NMAR机制下,如果将其看成是MAR机制,这样所得的参数估计是有偏的,由此可以看出,在做参数估计前检验缺失机制是很有必要的;最后考虑到logit模型在缺失数据处理中的大量使用,把对缺失机制的检验归结到求一个logit模型的参数估计问题。通过对模型参数估计的显著性的判断,给出了不同缺失机制的检验。文中用三个不同的例子给出了不同假设下检验的做法,这些例子本身同时也说明了这种做法是有效的。
引用
收藏
页数:38
共 6 条
[1]
Exact and approximate inferences for nonlinear mixed-effects models with missing covariates [J].
Wu, L .
JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 2004, 99 (467) :700-709
[2]
Analysis of smoking trends with incomplete longitudinal binary responses [J].
Preisser, JS ;
Galecki, AT ;
Lohman, KK ;
Wagenknecht, LE .
JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 2000, 95 (452) :1021-1031
[3]
Inference for imputation estimators.[J].JM Robins;N Wang.Biometrika.2000,
[4]
Using historical controls to adjust for covariates in trend tests for binary data [J].
Ibrahim, JG ;
Ryan, LM ;
Chen, MH .
JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 1998, 93 (444) :1282-1293
[6]
Maximum Likelihood from Incomplete Data via the EM Algorithm.[J].A. P. Dempster;N. M. Laird;D. B. Rubin.Journal of the Royal Statistical Society. Series.1977, 1