构建数据仓库过程中的数据清洗研究

被引:19
作者
刘喜文 [1 ]
郑昌兴 [1 ,2 ]
王文龙 [1 ]
汤刚强 [1 ]
机构
[1] 南京大学信息管理学院
[2] 南京政治学院基础部
关键词
数据清洗; 脏数据; 异常数据检测; 重复记录检测;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
文章对构建数据仓库中的数据清洗研究现状进行了论述。介绍了脏数据的类型与出现原因、数据清洗在国内外的研究现状、定义和对象,重点阐述了属性级异常数据和记录级异常数据的检测与处理算法;总结当前数据清洗研究的不足,并对今后数据清洗的研究进行展望。
引用
收藏
页码:22 / 28
页数:7
相关论文
共 33 条
[1]  
数据仓库.[M].(美)[W.H.因曼](W.H.Inmon)著;王志海等译;.机械工业出版社.2000,
[2]   一种基于多阅读器数据冗余的高效RFID数据清洗策略 [J].
马茜 ;
谷峪 ;
张天成 ;
于戈 .
小型微型计算机系统, 2012, 33 (10) :2158-2163
[3]   自适应时间阈值的RFID数据清洗算法 [J].
潘伟杰 ;
李少波 ;
许吉斌 .
制造业自动化, 2012, 34 (13) :24-27+36
[4]   中文数据清洗研究综述 [J].
叶鸥 ;
张璟 ;
李军怀 .
计算机工程与应用 , 2012, (14) :121-129
[5]   交通流数据清洗规则研究 [J].
王晓原 ;
张敬磊 ;
吴芳 .
计算机工程, 2011, 37 (20) :191-193
[6]   分流机制下的RFID不确定数据清洗策略 [J].
夏秀峰 ;
玄丽娟 ;
李晓明 .
计算机科学, 2011, 38(S1) (S1) :22-25
[7]   引入卡尔曼滤波的RFID数据清洗方法 [J].
王妍 ;
宋宝燕 ;
付菡 ;
李晓光 .
小型微型计算机系统, 2011, 32 (09) :1794-1799
[8]   聚类反馈学习的数据清洗研究 [J].
石彦华 ;
李蜀瑜 .
计算机工程与应用, 2011, 47 (30) :127-131
[9]   一种有效的多数据源RFID冗余数据清洗技术 [J].
潘巍 ;
李战怀 ;
聂艳明 ;
陈群 .
西北工业大学学报 , 2011, (03) :435-442
[10]   基于推理机的SCI地址字段数据清洗方法设计 [J].
张晋辉 ;
刘清 .
情报科学 , 2010, (05) :741-746