增量式ETL工具的研究与实现

被引:19
作者
章水鑫
徐宏炳
于立
机构
[1] 东南大学计算机科学与工程系
[2] 东南大学计算机科学与工程系 南京
[3] 南京
关键词
ETL; 数据仓库; 增量数据;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
利用数据源的增量数据对数据仓库进行维护,可以有效提高ETL效率。现有通用ETL工具在增量抽取方面存在一些问题,如不能抽取多个异构数据源的增量数据以及在处理增量数据时造成数据丢失的异常问题。本文从实践角度设计的增量式ETL工具采用集成多种增量数据捕获方式,解决异构数据源在捕获增量数据上的差异;在数据处理过程中,通过辅助表的手段解决了数据丢失的问题。在文章的最后,还介绍了ETL过程中数据转换和转换调度的实现。
引用
收藏
页码:6 / 10
页数:5
相关论文
共 6 条
[1]   基于共享数据库的多数据源集成 [J].
郭永生 ;
陈祎祺 ;
徐立臻 .
微机发展, 2004, (02) :49-51+113
[2]   数据ETL工具通用框架设计 [J].
周宏广 ;
周继承 ;
彭银桥 ;
龙思锐 .
计算机应用, 2003, (12) :96-98
[3]   企业数据仓库工具的研究与实现 [J].
谢小山 ;
陈有青 .
现代计算机(专业版), 2003, (08) :12-14+38
[4]   数据仓库系统中源数据的提取与集成 [J].
徐立臻 ;
谢鸿强 ;
董逸生 .
小型微型计算机系统, 2003, (05) :869-873
[5]   数据仓库中ETL技术的研究 [J].
张宁 ;
贾自艳 ;
史忠植 .
计算机工程与应用, 2002, (24) :213-216
[6]   浅论数据抽取、净化和转换工具 [J].
朱焱 .
计算机应用, 2000, (04) :1-3