一个可扩展的数据清洗系统

被引:11
作者
郭志懋
俞荣华
田增平
周傲英
机构
[1] 复旦大学计算机系
[2] 复旦大学计算机系 上海
[3] 上海
[4] 上海
关键词
数据准备; 数据清洗; 术语模型;
D O I
暂无
中图分类号
TP311.12 [];
学科分类号
摘要
在给数据挖掘这类应用准备数据的过程中,面临着一系列数据清洗问题。要把数 据清洗过程做得很灵活并不容易,已有的工具往往过于依赖特定的应用。该文提出并实现 了 一个可扩展的数据清洗框架。它以术语模型、过程描述文件、共享库等概念和技术实现 了模 块的高度独立性和系统的可扩展性,并提供了一个可视化的流程定义环境。
引用
收藏
页码:95 / 96+183 +183
页数:3
相关论文
共 2 条
[1]  
An Interactive Data Cleaning System. Raman V,Hellerstein J. The VLDB Journal . 2001
[2]  
Declarative Data Cleaning: Langua ge, Model and Algorithms. Galhardas H,Florescu D,Shaha D,et al. The VLDB Journal . 2001