数据ETL研究综述

被引:103
作者
徐俊刚
裴莹
机构
[1] 中国科学院研究生院信息科学与工程学院
关键词
ETL; 数据仓库; 数据质量; 元数据;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据抽取、转换和装载(Extraction,Transformation and Loading,简称ETL)是数据仓库化的关键环节,对数据仓库数据质量有着至关重要的影响。随着信息化的发展,ETL已经成为当前较活跃的研究领域之一,但是ETL理论和技术的发展还不成熟。针对当前ETL研究中存在的一些问题和需要考虑的各种因素,从ETL各个阶段存在的主要问题出发,列举了各种研究方法及研究成果,并进行了分析。最后,总结并提出了ETL的未来研究方向和今后工作的建议。
引用
收藏
页码:15 / 20
页数:6
相关论文
共 10 条
[1]   面向数据集成的ETL系统设计与实现 [J].
钟华 ;
冯文澜 ;
谭红星 ;
黄涛 .
计算机科学, 2004, (09) :87-89+202
[2]   数据仓库环境下以用户为中心的数据清洗过程模型 [J].
鲍玉斌 ;
孙焕良 ;
冷芳玲 ;
王大玲 ;
于戈 .
计算机科学, 2004, (05) :52-55
[3]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[4]   一种高效的检测相似重复记录的方法 [J].
邱越峰 ;
田增平 ;
季文贇 ;
周傲英 .
计算机学报, 2001, (01) :69-77
[5]   Field data extraction for form document processing using a gravitation-based algorithm [J].
Chen, JL ;
Lee, HJ .
PATTERN RECOGNITION, 2001, 34 (09) :1741-1750
[6]   An XML-enabled data extraction toolkit for web sources [J].
Liu, L ;
Pu, C ;
Han, W .
INFORMATION SYSTEMS, 2001, 26 (08) :563-583
[7]  
Arktos : towards the modeling, design, control and execution of ETL processes[J] . Panos Vassiliadis,Zografoula Vagena,Spiros Skiadopoulos,Nikos Karayannidis,Timos Sellis.Information Systems . 2001 (8)
[8]  
Real-world Data is Dirty: Data Cleansing and The Merge/Purge Problem[J] . Mauricio A. Hernández,Salvatore J. Stolfo.Data Mining and Knowledge Discovery . 1998 (1)
[9]  
Matching algorithms within a duplicate detection system .2 Monge A E. IEEE Data Engineer Bulletin . 2000
[10]  
Potter s Wheel: An Interactive Framework for Data Transformation and Cleaning .2 V.Raman,J.M.Hellerstein. Proceedings of the 27th VLDB conference . 2001