数据清理及其在数据仓库中的应用

被引:18
作者
庄晓青
徐立臻
董逸生
机构
[1] 东南大学计算机科学与工程系
关键词
数据仓库; 数据清理; 模式冲突; ETL(Extraction Transformation Loading);
D O I
暂无
中图分类号
TP311 [程序设计、软件工程];
学科分类号
摘要
数据仓库是为决策服务的,这里的数据是从各种异构的数据源中采集过来的。由于各个数据源中的数据可能存在错误以及种种不一致性,因而为了确保决策数据的质量必须要对各个数据源中抽取出来的数据进行清理转换。数据清理就是发现数据源中数据的错误并加以清除或修改,发现和纠正数据源之间数据的不一致性。分析了数据清理概念和方法以及在数据仓库中的应用。
引用
收藏
页码:147 / 149
页数:3
相关论文
共 2 条
  • [1] An Overview of Data Warehousing and OLAP Technology. Surajit Chaudhuri,Umeshwar Dayal. SIGMOD Record . 1997
  • [2] Data Cleaning: Problems and Current Approaches. Erhard Rahm,H Hai Do. Data Engineering . 2000