中文数据清洗研究综述

被引:39
作者
叶鸥
张璟
李军怀
机构
[1] 西安理工大学计算机科学与技术学院
关键词
中文数据清洗; 数据质量管理; 数据集成;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对中文数据清洗研究进行了综述。阐明了全面数据质量管理与数据清洗之间的关系,给出数据清洗的定义及对象;介绍中文数据清洗问题产生的背景、国内外研究现状与研究热点,并简介其基本原理、模型及已有算法;着重阐明了中文数据清洗的方法;总结中文数据清洗研究的不足,并对中文数据清洗的研究及应用进行了展望。
引用
收藏
页码:121 / 129
页数:9
相关论文
共 15 条
[1]   一种基于Token匹配的中文数据清洗方法 [J].
刘嘉 ;
张璟 ;
李军怀 .
计算机应用与软件, 2009, 26 (11) :43-45+53
[2]   面向XML数据库的智能数据清洗策略 [J].
刘波 ;
杨路明 ;
雷刚跃 ;
邓云龙 .
计算机工程, 2008, (16) :16-18
[3]   数据质量研究综述 [J].
韩京宇 ;
徐立臻 ;
董逸生 .
计算机科学, 2008, (02) :1-5+12
[4]   数据清洗研究综述 [J].
王曰芬 ;
章成志 ;
张蓓蓓 ;
吴婷婷 .
现代图书情报技术, 2007, (12) :50-56
[5]   面向信息检索需要的网络数据清理研究 [J].
刘奕群 ;
张敏 ;
马少平 .
中文信息学报, 2006, (03) :70-77
[6]   一种在线数据清洗方法 [J].
韩京宇 ;
胡孔法 ;
徐立臻 ;
董逸生 .
应用科学学报, 2005, (03) :292-296
[7]   数据转换过程的串行化方法 [J].
方幼林 ;
杨冬青 ;
唐世渭 ;
张卫华 ;
余利波 ;
付强 .
计算机工程与应用 , 2003, (17) :4-6+187
[8]   数据仓库中数据质量控制研究 [J].
方幼林 ;
杨冬青 ;
唐世渭 ;
张卫华 ;
余利波 ;
付强 .
计算机工程与应用 , 2003, (13) :1-4
[9]   一个可扩展的数据清洗系统 [J].
郭志懋 ;
俞荣华 ;
田增平 ;
周傲英 .
计算机工程, 2003, (03) :95-96+183
[10]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082