大数据背景下非概率抽样的统计推断问题

被引:38
作者
金勇进 [1 ,2 ]
刘展 [3 ]
机构
[1] 中国人民大学应用统计科学研究中心
[2] 中国人民大学统计学院
[3] 中国人民大学
关键词
大数据; 非概率抽样; 统计推断;
D O I
10.19343/j.cnki.11-1302/c.2016.03.002
中图分类号
C81 [统计方法];
学科分类号
020208 ; 0714 ;
摘要
利用大数据进行抽样,很多情况下由于抽样框的构造比较困难,使得抽取的样本属于非概率样本,传统的抽样推断理论难以应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,本文以基于样本匹配的样本选择为例探讨了具体解决方法。
引用
收藏
页码:11 / 17
页数:7
相关论文
共 5 条
[1]   被访者驱动抽样在农民工调查中的应用:实践与评估 [J].
刘林平 ;
范长煜 ;
王娅 .
社会学研究, 2015, 30 (02) :149-173+244
[2]  
网络调查研究方法概论.[M].赵国栋; 黄永中; 著.北京大学出版社.2007,
[3]   A smarter way to select respondents for surveys? [J].
Terhanian, George ;
Bremer, John .
INTERNATIONAL JOURNAL OF MARKET RESEARCH, 2012, 54 (06) :751-780
[4]   The 2006 Cooperative Congressional Election Study [J].
Vavreck, Lynn ;
Rivers, Douglas .
JOURNAL OF ELECTIONS PUBLIC OPINION AND PARTIES, 2008, 18 (04) :355-366
[5]  
Does matching overcome LaLonde's critique of nonexperimental estimators?.[J].Jeffrey A. Smith;Petra E. Todd.Journal of Econometrics.2004, 1