数据完整性的评估方法

被引:11
作者
刘永楠 [1 ]
邹兆年 [1 ]
李建中 [1 ]
王海洁 [2 ]
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 哈尔滨工业大学网络与信息中心
关键词
数据质量; 数据完整性; 均匀抽样; 近似算法; 数据完整性模型;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着信息技术的发展,数据的规模正在高速增长,数据中普遍存在质量问题.针对海量关系数据中普遍存在的数据不完整现象,研究了关系数据完整性度量问题.针对数据的完整性计算问题,提出了数据完整性计算模型,以及精确算法和基于均匀抽样的近似算法.理论分析证明了近似算法可以达到任意的精度要求,可以高效地对数据完整性进行计算.通过在DBLP数据上的实验验证了算法的有效性和高效性.
引用
收藏
页码:230 / 238
页数:9
相关论文
共 6 条
[1]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[2]   Relative Information Completeness [J].
Fan, Wenfei ;
Geerts, Floris .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 2010, 35 (04)
[3]  
Data exchange: semantics and query answering[J] . Ronald Fagin,Phokion G. Kolaitis,Renée J. Miller,Lucian Popa.Theoretical Computer Science . 2004 (1)
[4]  
Completeness of integrated information sources[J] . Felix Naumann,Johann-Christoph Freytag,Ulf Leser.Information Systems . 2003 (7)
[5]   INTEGRITY = VALIDITY + COMPLETENESS [J].
MOTRO, A .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 1989, 14 (04) :480-502
[6]   INCOMPLETE INFORMATION IN RELATIONAL DATABASES [J].
IMIELINSKI, T ;
LIPSKI, W .
JOURNAL OF THE ACM, 1984, 31 (04) :761-791