数据整理——大数据治理的关键技术

被引:44
作者
杜小勇 [1 ,2 ]
陈跃国 [1 ,2 ]
范举 [1 ,2 ]
卢卫 [1 ,2 ]
机构
[1] 中国人民大学信息学院
[2] 数据工程与知识工程教育部重点实验室(中国人民大学)
关键词
数据整理; 数据准备; 数据治理; 数据管理;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据是政府、企业和机构的重要资源。数据治理关注数据资源有效利用的众多方面,如数据资产确权、数据管理、数据开放共享、数据隐私保护等。从数据管理的角度,探讨了数据治理中的一项关键技术:数据整理。介绍了以数据拥有者和直接使用者(行业用户)为核心的数据整理的关键技术,包括数据结构化处理、数据质量评估及数据清洗、数据规范化、数据融合与摘取、数据整理的发布共享等。最后,针对加强数据整理方面的研究提出了一些思考。
引用
收藏
页码:13 / 22
页数:10
相关论文
共 3 条
[1]  
数据集成与应用集成[M]. 中国水利水电出版社 , 宋晓宇等, 2008
[2]  
Crowdsourced data management:overview and challenges .2 L IGL,Z H E N GYD,FA NJ,e ta l. The 2017 ACM International Conference on Management of Data . 2017
[3]  
Detecting data errors:where are we and what needs to be done .2 ABEDJAN Z,CHU X,DENG D,et al. Proceedings of the VLDB Endowment . 2016