全数据模式的幻象与网络大数据的代表性

被引:2
作者
陈峥
机构
[1] 武汉大学社会学系博士后流动站
关键词
大数据; 数据代表性; 数字鸿沟; 用户偏好;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据时代为计算社会科学的发展提供了契机。有一种观点认为,由于大数据是"样本=总体",因此它不存在采样偏差和数据代表性问题。虽然大数据驱动下的社会科学研究取得诸多成果,但也有不少失败的案例,对这些案例进行分析可见,"总体数据"是相对于具体的研究对象和研究问题而言的,大数据时代并不能保证社会科学开展全数据模式研究。数字鸿沟、用户偏好等客观存在的问题,使网络大数据往往是用户自我选择样本。在很多情况下,"全数据模式"只是缺乏深思明辨而勾勒出的一幅幻象,社会科学研究者应对此具备清醒的认识,方能作出高质量的研究。
引用
收藏
页码:74 / 80
页数:7
相关论文
共 9 条
  • [1] 数据密集型知识发现的边界与陷阱——以美国大选预测为例
    罗俊
    罗教讲
    [J]. 学术论坛, 2017, 40 (03) : 1 - 7
  • [2] 大数据时代[M]. 浙江人民出版社 , 迈耶-舍恩伯格, 2012
  • [3] Follow thy neighbor: Connecting the social and the spatial networks on Twitter[J] . Monica Stephens,Ate Poorthuis. Computers, Environment and Urban Systems . 2015
  • [4] Is Bigger Always Better? Potential Biases of Big Data Derived from Social Network Sites[J] . The Annals of the American Academy of Political a . 2015
  • [5] CRITICAL QUESTIONS FOR BIG DATA[J] . danah boyd,Kate Crawford. Information, Communication & Society . 2012 (5)
  • [6] Following you: Disciplines of listening in social media[J] . Kate Crawford. Continuum . 2009 (4)
  • [7] Facebook的数据仓库是如何扩展到300PB的 .2 梁堰波. https://www.csdn.net/article/2014-12-09/2823024 . 2018
  • [8] 窗体底端百度大数据首席架构师林仕鼎介绍百度大数据 .2 王晓易. http://tech.163.com/13/1206/10/9FDG6V0H00094OB0.html . 2018
  • [9] From the''Digital Divide''to''Digital Inequality'':Studying Internet use as Penetration Increases .2 DIMAGGIO P,HARGITTAI E. Current Opinion in Obstetrics&Gynecology . 2001