单位名录库更新:互联网大数据源及其数据质量评估

被引:9
作者
黄恒君 [1 ]
陶然 [2 ]
傅德印 [3 ]
机构
[1] 兰州财经大学统计学院
[2] 国家统计局统计科学研究所
[3] 不详
关键词
大数据; 名录库; 政府统计; 数据质量;
D O I
10.19343/j.cnki.11-1302/c.2017.01.002
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在大数据时代,互联网数据资源的充分利用对提高政府统计能力的影响是不可忽视的,但互联网数据质量问题值得探讨。以单位名录库为研究对象,本文讨论了互联网数据作为单位名录库更新数据源的质量评估方法,从多维度视角比较分析了互联网数据源与传统数据源的数据质量;从准确性方面探讨了互联网数据源的数据质量评估框架,给出了单源质量评估、多源整合评估、事件信息辅助评估的做法和要点。分析结果表明,互联网数据源能够完成名录库"及时更新"的任务,可以辅助实现名录库更新的"真实准确"和"不重不漏",但不足以生成"统一完整"的名录库。同时,本文利用大众点评网、百度糯米网、地理信息系统等异源异构数据整合,给出了一个餐饮业名录库更新的数据质量评估实例。
引用
收藏
页码:12 / 22
页数:11
相关论文
共 4 条