让大数据分析更可信

被引:2
作者
王腾蛟
李喜莲
机构
[1] 北京大学信息科学技术学院
基金
国家重点研发计划;
关键词
大数据; 数据仓库; 海量数据; 大数据工程;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据在学术界和产业界的各个领域正扮演着愈加重要的角色,但同时,大数据是否可信,引发了无数研究者的广泛关注和激烈讨论。从大数据名称的历史演变、大数据应用的案例分析以及大数据工程的角度探索大数据的可信程度,并由此总结出保证大数据分析正确性需要解决的3个挑战:正确选择数据源、科学抽样有代表性和有价值的数据、严谨完备的大数据工程分析方法。
引用
收藏
页码:31 / 37
页数:7
相关论文
共 3 条
[1]  
Automating Open Science for Big Data[J] . The Annals of the American Academy of Political a . 2015
[2]  
Digital Footprints: Opportunities and Challenges for Online Social Research[J] . Scott A. Golder,Michael W. Macy.Annual Review of Sociology . 2014
[3]  
Economics in the age of big data .2 Einav L,Levin J. Science . 2014