ETL架构研究

被引:23
作者
孙伟
张忠能
机构
[1] 上海交通大学软件学院
关键词
数据采集; 数据中心; 数据抽取; 数据转换; 数据装载;
D O I
暂无
中图分类号
TP311 [程序设计、软件工程];
学科分类号
摘要
ETL(Extract、Transform、Loading)是企业数据中心(EDC)建设过程中必不可少的、最重要的环节。传统的采集模式中,整个ETL过程在一起被顺序的执行,这样对于有许多采集点(数据源)来说降低了工作效率,同时也增加了ETL的编写难度。本文提出一种新的ETL方式,通过增加中间层——临时数据存储区,把ETL的三个过程拆开,形成三个独立的服务进程,采集服务进程、装载服务进程和转换服务进程,达到提升数据抽取、转换和装载的效率,同时降低ETL代码编写的复杂度。
引用
收藏
页码:13 / 15+1 +1
页数:4
相关论文
empty
未找到相关数据