共 15 条
中文数据清洗研究综述
被引:39
作者:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

李军怀
论文数: 0 引用数: 0
h-index: 0
机构: 西安理工大学计算机科学与技术学院
机构:
[1] 西安理工大学计算机科学与技术学院
来源:
关键词:
中文数据清洗;
数据质量管理;
数据集成;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
针对中文数据清洗研究进行了综述。阐明了全面数据质量管理与数据清洗之间的关系,给出数据清洗的定义及对象;介绍中文数据清洗问题产生的背景、国内外研究现状与研究热点,并简介其基本原理、模型及已有算法;着重阐明了中文数据清洗的方法;总结中文数据清洗研究的不足,并对中文数据清洗的研究及应用进行了展望。
引用
收藏
页码:121 / 129
页数:9
相关论文
共 15 条
[1]
一种基于Token匹配的中文数据清洗方法
[J].
刘嘉
;
张璟
;
李军怀
.
计算机应用与软件,
2009, 26 (11)
:43-45+53

论文数: 引用数:
h-index:
机构:

张璟
论文数: 0 引用数: 0
h-index: 0
机构: 西安理工大学计算机科学与工程学院

论文数: 引用数:
h-index:
机构:
[2]
面向XML数据库的智能数据清洗策略
[J].
刘波
;
杨路明
;
雷刚跃
;
邓云龙
.
计算机工程,
2008, (16)
:16-18

刘波
论文数: 0 引用数: 0
h-index: 0
机构:
中南大学信息学院 中南大学信息学院

杨路明
论文数: 0 引用数: 0
h-index: 0
机构:
中南大学信息学院 中南大学信息学院

雷刚跃
论文数: 0 引用数: 0
h-index: 0
机构:
湖南信息职业技术学院 中南大学信息学院

邓云龙
论文数: 0 引用数: 0
h-index: 0
机构:
中南大学湘雅附三医院 中南大学信息学院
[3]
数据质量研究综述
[J].
韩京宇
;
徐立臻
;
董逸生
.
计算机科学,
2008, (02)
:1-5+12

论文数: 引用数:
h-index:
机构:

徐立臻
论文数: 0 引用数: 0
h-index: 0
机构:
东南大学计算机科学与工程系 中科院软件所基础软件国家工程中心

董逸生
论文数: 0 引用数: 0
h-index: 0
机构:
东南大学计算机科学与工程系 中科院软件所基础软件国家工程中心
[4]
数据清洗研究综述
[J].
王曰芬
;
章成志
;
张蓓蓓
;
吴婷婷
.
现代图书情报技术,
2007, (12)
:50-56

王曰芬
论文数: 0 引用数: 0
h-index: 0
机构: 南京理工大学经济管理学院

章成志
论文数: 0 引用数: 0
h-index: 0
机构: 南京理工大学经济管理学院

论文数: 引用数:
h-index:
机构:

吴婷婷
论文数: 0 引用数: 0
h-index: 0
机构: 南京理工大学经济管理学院
[5]
面向信息检索需要的网络数据清理研究
[J].
刘奕群
;
张敏
;
马少平
.
中文信息学报,
2006, (03)
:70-77

刘奕群
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机系智能技术与系统国家重点实验室

张敏
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机系智能技术与系统国家重点实验室

马少平
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机系智能技术与系统国家重点实验室
[6]
一种在线数据清洗方法
[J].
韩京宇
;
胡孔法
;
徐立臻
;
董逸生
.
应用科学学报,
2005, (03)
:292-296

韩京宇
论文数: 0 引用数: 0
h-index: 0
机构: 东南大学计算机科学与工程系

胡孔法
论文数: 0 引用数: 0
h-index: 0
机构: 东南大学计算机科学与工程系

徐立臻
论文数: 0 引用数: 0
h-index: 0
机构: 东南大学计算机科学与工程系

董逸生
论文数: 0 引用数: 0
h-index: 0
机构: 东南大学计算机科学与工程系
[7]
数据转换过程的串行化方法
[J].
方幼林
;
杨冬青
;
唐世渭
;
张卫华
;
余利波
;
付强
.
计算机工程与应用 ,
2003, (17)
:4-6+187

方幼林
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

杨冬青
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

唐世渭
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

张卫华
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

余利波
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

付强
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系
[8]
数据仓库中数据质量控制研究
[J].
方幼林
;
杨冬青
;
唐世渭
;
张卫华
;
余利波
;
付强
.
计算机工程与应用 ,
2003, (13)
:1-4

方幼林
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

杨冬青
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

唐世渭
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

张卫华
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

余利波
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系

付强
论文数: 0 引用数: 0
h-index: 0
机构: 北京大学计算机科学与技术系
[9]
一个可扩展的数据清洗系统
[J].
郭志懋
;
俞荣华
;
田增平
;
周傲英
.
计算机工程,
2003, (03)
:95-96+183

郭志懋
论文数: 0 引用数: 0
h-index: 0
机构: 复旦大学计算机系

俞荣华
论文数: 0 引用数: 0
h-index: 0
机构: 复旦大学计算机系

田增平
论文数: 0 引用数: 0
h-index: 0
机构: 复旦大学计算机系

周傲英
论文数: 0 引用数: 0
h-index: 0
机构: 复旦大学计算机系
[10]
数据质量和数据清洗研究综述
[J].
郭志懋
;
周傲英
.
软件学报,
2002, (11)
:2076-2082

郭志懋
论文数: 0 引用数: 0
h-index: 0
机构: 复旦大学计算机科学与工程系

周傲英
论文数: 0 引用数: 0
h-index: 0
机构: 复旦大学计算机科学与工程系