一种可交互的数据清洗系统

被引:7
作者
王咏梅
陈家琪
耿玉良
机构
[1] 上海理工大学计算机工程系
关键词
数据质量; 数据清洗; 可交互式;
D O I
10.16208/j.issn1000-7024.2005.04.036
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对于各个领域的信息资源而言,数据质量一直是一个非常关键的问题,而现实世界中的数据往往存在着各种各样的质量问题,从简单的拼写错误到复杂的语义不一致错误。数据清洗的目标就是检测并去除数据中存在的各种错误和不一致,提高数据质量。在归纳总结数据质量问题和数据清洗相关研究的现状的基础上提出一个可交互的数据清洗框架的定义。系统提供了方便、易用的可视化的数据清洗流程定义环境。
引用
收藏
页码:955 / 957
页数:3
相关论文
共 2 条