公共数据中心的ETL系统设计与实现

被引:9
作者
赵俊
夏小玲
机构
[1] 东华大学计算机科学与技术学院
关键词
ETL; 数据仓库; 数据抽取; 数据转换; 数据质量;
D O I
暂无
中图分类号
TP308 [机房]; TP311.13 [];
学科分类号
0812 ; 1201 ;
摘要
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
引用
收藏
页码:167 / 169+190 +190
页数:4
相关论文
共 6 条
[1]   基于COW模式下的ETL应用研究 [J].
周四维 ;
曾记 ;
李跃新 .
武汉科技学院学报, 2009, 22 (02) :21-24
[2]   一种轻量级架构的ETL系统设计与实现 [J].
黄怀毅 ;
杨路明 .
计算机技术与发展, 2008, (06) :202-205
[3]   政务数据中心的设计与实现 [J].
王朝静 .
电子政务, 2007, (08) :78-81
[4]   一种标准的ETL的设计思想及其实现 [J].
程跟上 ;
郑洪源 ;
丁秋林 .
计算机应用研究, 2005, (03) :101-103
[5]   数据ETL工具通用框架设计 [J].
周宏广 ;
周继承 ;
彭银桥 ;
龙思锐 .
计算机应用, 2003, (12) :96-98
[6]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082