大数据融合研究:问题与挑战

被引:226
作者
孟小峰
杜治娟
机构
[1] 中国人民大学信息学院
基金
高等学校博士学科点专项科研基金;
关键词
大数据; 数据集成; 数据融合; 知识融合; 数据管理;
D O I
暂无
中图分类号
TP311.13 []; TP202 [设计、性能分析与综合];
学科分类号
140102 [集成电路设计与设计自动化];
摘要
随着大规模数据的关联和交叉,数据特征和现实需求都发生了变化.以大规模、多源异构、跨领域、跨媒体、跨语言、动态演化、普适化为主要特征的数据发挥着更重要的作用,相应的数据存储、分析和理解也面临着重大挑战.当下亟待解决的问题是如何利用数据的关联、交叉和融合实现大数据的价值最大化.认为解决这一问题的关键在于数据的融合,所以提出了大数据融合的概念.首先以Web数据、科学数据和商业数据的融合作为案例分析了大数据融合的需求和必要性,并提出了大数据融合的新任务;然后,总结分析了现有融合技术;最后针对大数据融合问题可能面临的挑战和大数据融合带来的问题进行了分析.
引用
收藏
页码:231 / 246
页数:16
相关论文
共 18 条
[1]
Top- k queries on RDF graphs.[J].Dong Wang;Lei Zou;Dongyan Zhao.Information Sciences.2015,
[2]
Ontology Integration for Linked Data [J].
Zhao, Lihua ;
Ichise, Ryutaro .
JOURNAL ON DATA SEMANTICS, 2014, 3 (04) :237-254
[3]
Modeling ontology evolution with SetPi.[J].Lei Liu;Peng Zhang;Rong Fan;Rui Zhang;Hongji Yang.Information Sciences.2014,
[4]
Incremental entity resolution on rules and data.[J].Steven Euijong Whang;Hector Garcia-Molina.The VLDB Journal.2014, 1
[5]
Ontology Change Management and Identification of Change Patterns [J].
Javed, Muhammad ;
Abgaz, Yalemisew M. ;
Pahl, Claus .
JOURNAL ON DATA SEMANTICS, 2013, 2 (2-3) :119-143
[6]
COnto–Diff : generation of complex evolution mappings for life science ontologies.[J]..Journal of Biomedical Informatics.2012,
[7]
Factorization Machines with libFM [J].
Rendle, Steffen .
ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, 2012, 3 (03)
[8]
Linking temporal records [J].
Li, Pei ;
Dong, Xin Luna ;
Maurino, Andrea ;
Srivastava, Divesh .
FRONTIERS OF COMPUTER SCIENCE, 2012, 6 (03) :293-312
[9]
Fast and Accurate Annotation of Short Texts with Wikipedia Pages [J].
Ferragina, Paolo ;
Scaiella, Ugo .
IEEE SOFTWARE, 2012, 29 (01) :70-75
[10]
Relational retrieval using a combination of path-constrained random walks [J].
Lao, Ni ;
Cohen, William W. .
MACHINE LEARNING, 2010, 81 (01) :53-67