数据治理技术

被引:182
作者
吴信东 [1 ,2 ,3 ,4 ]
董丙冰 [2 ,3 ,4 ]
堵新政 [1 ]
杨威 [1 ]
机构
[1] 明略科技集团
[2] 合肥工业大学大知识科学研究院
[3] 大数据知识工程教育部重点实验室(合肥工业大学)
[4] 合肥工业大学计算机与信息学院
基金
国家重点研发计划;
关键词
数据治理; 数据规范; 数据清洗; 数据交换; 数据集成;
D O I
10.13328/j.cnki.jos.005854
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着信息技术的普及,人类产生的数据量正在以指数级的速度增长,如此海量的数据就要求利用新的方法来管理.数据治理是将一个机构(企业或政府部门)的数据作为战略资产来管理,需要从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化.目前,各行各业对大数据的研究比较火热,但对于大数据治理的研究还处于起步阶段,一个组织的正确决策离不开良好的数据治理.首先介绍数据治理和大数据治理的概念、发展以及应用的必要性;其次,对已有的数据治理技术——数据规范、数据清洗、数据交换和数据集成进行具体的分析,并介绍了数据治理成熟度和数据治理框架设计;在此基础上,提出了大数据HAO治理模型.该模型以支持人类智能(HI)、人工智能(AI)和组织智能(OI)的三者协同为目标,再以公安的数据治理为例介绍HAO治理的应用;最后是对数据治理的总结和展望.
引用
收藏
页码:2830 / 2856
页数:27
相关论文
共 34 条
[1]   MapReduce与Spark用于大数据分析之比较 [J].
吴信东 ;
嵇圣硙 .
软件学报, 2018, 29 (06) :1770-1791
[2]   一种准确而高效的领域知识图谱构建方法 [J].
杨玉基 ;
许斌 ;
胡家威 ;
仝美涵 ;
张鹏 ;
郑莉 .
软件学报, 2018, 29 (10) :2931-2947
[3]   大数据可用性的研究进展 [J].
李建中 ;
王宏志 ;
高宏 .
软件学报, 2016, 27 (07) :1605-1625
[4]   从大数据到大知识:HACE+BigKE [J].
吴信东 ;
何进 ;
陆汝钤 ;
郑南宁 .
自动化学报, 2016, 42 (07) :965-982
[5]   知识图谱构建技术综述 [J].
刘峤 ;
李杨 ;
段宏 ;
刘瑶 ;
秦志光 .
计算机研究与发展, 2016, 53 (03) :582-600
[6]  
大数据融合研究:问题与挑战[J]. 孟小峰,杜治娟.计算机研究与发展. 2016(02)
[7]   基于任务合并的并行大数据清洗过程优化 [J].
杨东华 ;
李宁宁 ;
王宏志 ;
李建中 ;
高宏 .
计算机学报, 2016, 39 (01) :97-108
[8]   大数据隐私保护密码技术研究综述 [J].
黄刘生 ;
田苗苗 ;
黄河 .
软件学报, 2015, 26 (04) :945-959
[9]   云计算安全研究 [J].
冯登国 ;
张敏 ;
张妍 ;
徐震 .
软件学报, 2011, 22 (01) :71-83
[10]   Deep Web数据集成研究综述 [J].
刘伟 ;
孟小峰 ;
孟卫一 .
计算机学报, 2007, (09) :1475-1489