数据清理综述

被引:24
作者
杨辅祥
刘云超
段智华
机构
[1] 上海大学计算机系
[2] 上海大学计算机系 上海
[3] 上海
关键词
数据清理; 数据质量; 异常; 记录重复;
D O I
暂无
中图分类号
TP311.131 [];
学科分类号
1201 ;
摘要
由于各种原因 ,数据中存在这样或那样的脏数据需要清理 (净化 )。特别是数据仓库、KDD及TDQM(综合数据质量管理 )中 ,必须对数据进行清理。介绍了数据清理的有关内容、技术与实现方案 ,着重介绍了目前的两个重点研究、应用内容 :异常发现与记录重复
引用
收藏
页码:3 / 5
页数:3
相关论文
共 4 条
[1]   Real-world data is dirty: Data cleansing and the merge/purge problem [J].
Hernandez, MA ;
Stolfo, SJ .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (01) :9-37
[2]  
ARKTOS :AToolForDataCleaningandTransformationinDataWarehouseEnvironments..PanosVassiliadis;etal;..,
[3]  
AnInteractiveFrameworkforDataTransforma tionandCleaning..EsmondGNg;..,
[4]  
决策支持系统及其开发.[M].陈文伟编著;.清华大学出版社.2000,