基于数据仓库的ETL过程优化

被引:10
作者
彭璐
机构
[1] 武汉科技大学城市学院信息工程学部
关键词
数据仓库; ETL; 数据清理; 数据集成; EICLF;
D O I
暂无
中图分类号
TP311.132 [];
学科分类号
1201 ;
摘要
提出一种优化ETL整体过程的方法,包括:其一,针对现有ETL过程的局限性提出一个优化其整体流程的框架EICLF(Extracting/Integrating/Cleaning/Loading/Feedback)流程;其二,对现有相似重复记录的识别算法进行改进;其三,根据清理后得到的干净数据对源数据进行反馈处理。
引用
收藏
页码:166 / 169
页数:4
相关论文
共 1 条
[1]  
DataWarehousingFoundamentals.2PaulrajPonniah.电子工业出版社.2004