一种开放式数据清理框架

被引:4
作者
陆凤霞
王静秋
王宁生
机构
[1] 南京航空航天大学机电学院
关键词
数据清理; 规则库; 算法库; 框架; 数据质量;
D O I
10.16356/j.1005-2615.2006.04.013
中图分类号
TP311.52 [];
学科分类号
081202 ; 0835 ;
摘要
从提高制造业信息化中数据质量的角度出发,分析了建立基于规则库和算法库的可扩展数据清理框架的必要性,设计了一种基于多种规则结合不同算法以流程方式完成清理任务的可重构的数据清理框架。在框架的设计中,以实例方式总结了数据质量问题的分类,详细阐述了该框架的结构、组成部分以及工作流程。最后,通过数据清理实例说明了该框架中流程的实现及其工作过程。本文提出的数据清理框架功能将随着不同领域清理任务的完成而不断完善。
引用
收藏
页码:459 / 463
页数:5
相关论文
共 5 条
[1]   具有数据清理功能的交互式数据迁移及应用 [J].
陈伟 ;
丁秋林 .
吉林大学学报(信息科学版), 2004, (02) :148-153
[2]   数据清理方法 [J].
佘春红 .
计算机应用, 2002, (12) :128-130
[3]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[4]   数据清理综述 [J].
杨辅祥 ;
刘云超 ;
段智华 .
计算机应用研究, 2002, (03) :3-5
[5]  
On the Weighted Mean of a Pair of Strings[J] . Horst Bunke,Xiaoyi Jiang,Karin Abegglen,Abraham Kandel.Pattern Analysis & Applications . 2002 (1)