大数据的一个重要方面:数据可用性

被引:261
作者
李建中
刘显敏
机构
[1] 哈尔滨工业大学计算机科学与技术学院
基金
国家自然科学基金重点项目;
关键词
大数据; 数据可用性; 数据一致性; 数据完整性; 数据精确性; 数据时效性; 实体同一性;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着信息技术的发展,特别是物理信息系统、互联网、云计算和社交网络等技术的突飞猛进,大数据普遍存在,正在成为信息社会的重要财富,同时也带来了巨大的挑战.数据可用性问题就是大数据的重要挑战之一.随着数据的爆炸性增长,劣质数据也随之而来,数据可用性受到严重影响,对信息社会形成严重威胁,引起了学术界和工业界的共同关注.近年来,学术界和工业界开始研究数据可用性问题,取得了一些的研究成果,但是针对大数据可用性问题的研究工作还很少.介绍了大数据可用性的基本概念,讨论大数据可用性的挑战,探讨大数据可用性方面的研究问题,并综述数据可用性方面的研究成果.
引用
收藏
页码:1147 / 1162
页数:16
相关论文
共 28 条
  • [1] Mining frequent subgraphs over uncertain graph databases under probabilistic semantics[J] . Jianzhong Li,Zhaonian Zou,Hong Gao.The VLDB Journal . 2012 (6)
  • [2] Determining the Currency of Data
    Fan, Wenfei
    Geerts, Floris
    Wijsen, Jef
    [J]. ACM TRANSACTIONS ON DATABASE SYSTEMS, 2012, 37 (04):
  • [3] Efficient Similarity Joins for Near-Duplicate Detection
    Xiao, Chuan
    Wang, Wei
    Lin, Xuemin
    Yu, Jeffrey Xu
    Wang, Guoren
    [J]. ACM TRANSACTIONS ON DATABASE SYSTEMS, 2011, 36 (03):
  • [4] XML with Incomplete Information
    Barcelo, Pablo
    Libkin, Leonid
    Poggi, Antonella
    Sirangelo, Cristina
    [J]. JOURNAL OF THE ACM, 2010, 58 (01)
  • [5] Development and user experiences of an open source data cleaning, deduplication and record linkage system[J] . Peter Christen.ACM SIGKDD Explorations Newsletter . 2009 (1)
  • [6] Creating probabilistic databases from duplicated data
    Hassanzadeh, Oktie
    Miller, Renee J.
    [J]. VLDB JOURNAL, 2009, 18 (05) : 1141 - 1166
  • [7] Generic entity resolution with negative rules[J] . Steven Euijong Whang,Omar Benjelloun,Hector Garcia-Molina.The VLDB Journal . 2009 (6)
  • [8] Conditional functional dependencies for capturing data inconsistencies
    Fan, Wenfei
    Geerts, Floris
    Jia, Xibei
    Kementsietsidis, Anastasios
    [J]. ACM TRANSACTIONS ON DATABASE SYSTEMS, 2008, 33 (02):
  • [9] Swoosh: a generic approach to entity resolution[J] . Omar Benjelloun,Hector Garcia-Molina,David Menestrina,Qi Su,Steven Euijong Whang,Jennifer Widom.The VLDB Journal . 2009 (1)
  • [10] Representing and querying XML with incomplete information
    Abiteboul, Serge
    Segoufin, Luc
    Vianu, Victor
    [J]. ACM TRANSACTIONS ON DATABASE SYSTEMS, 2006, 31 (01): : 208 - 254