领域无关数据清洗研究综述

被引:27
作者
曹建军
刁兴春
汪挺
王芳潇
机构
[1] 总参第研究所
关键词
数据质量; 数据清洗; 数据集成; 领域无关数据清洗;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对领域无关数据清洗的研究进行了综述。首先阐明了全面数据质量管理、数据集成和数据清洗之间的关系,着重说明了领域无关数据清洗的特点。将领域无关数据清洗方法分为基于特征相似度的方法、基于上下文的方法和基于关系的方法分别介绍。最后对领域无关数据清洗的研究方向进行了展望。
引用
收藏
页码:26 / 29
页数:4
相关论文
共 12 条
[1]   一种求解子集问题的基于图的蚂蚁系统 [J].
曹建军 ;
张培林 ;
王艳霞 ;
任国全 ;
傅建平 .
系统仿真学报, 2008, (22) :6146-6150
[2]   一种基于VSM的检测相似重复记录的方法 [J].
张昌年 .
微电子学与计算机, 2008, (08) :184-187
[3]   数据质量研究综述 [J].
韩京宇 ;
徐立臻 ;
董逸生 .
计算机科学, 2008, (02) :1-5+12
[4]   数据清洗研究综述 [J].
王曰芬 ;
章成志 ;
张蓓蓓 ;
吴婷婷 .
现代图书情报技术, 2007, (12) :50-56
[5]   数据ETL研究与展望 [J].
管丽娟 .
电脑知识与技术, 2007, (06) :1512-1514
[6]   一种提高相似重复记录检测精度的方法 [J].
陈伟 ;
王昊 ;
朱文明 .
计算机应用与软件, 2006, (10) :29-30+42
[7]   一种大数据量的相似记录检测方法 [J].
韩京宇 ;
徐立臻 ;
董逸生 .
计算机研究与发展, 2005, (12) :2206-2212
[8]   数据集成综述 [J].
陈跃国 ;
王京春 .
计算机科学, 2004, (05) :48-51
[9]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[10]   一种检测多语言文本相似重复记录的综合方法 [J].
俞荣华 ;
田增平 ;
周傲英 .
计算机科学, 2002, (01) :118-121