基于工作流的数据抽取转换加载

被引:5
作者
谭支鹏
冯丹
吴永英
彭峰
机构
[1] 华中科技大学计算机科学与技术学院
关键词
数据的抽取转换加载; 数据仓库; 数据迁移; 工作流;
D O I
10.13245/j.hust.2006.02.020
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
将数据的抽取转换加载(ETL)过程和工作流技术结合起来,研究了ETL过程的工作流调度问题,设计了一种简单串行和稳定可靠的循环遍历算法.为了提高ETL效率,将并行机制引入到节点访问算法中,对节点访问算法进行了改进,设计了新的节点访问算法,并讨论了加入并行机制后可能会遇到的数据源并发控制等问题,并给出了解决方法.所提出的方法对提高数据集成效率很有效,在国产数据库系统的应用中可起到积极推动作用.
引用
收藏
页码:61 / 63+69 +69
页数:4
相关论文
共 5 条
[1]  
Trans-forming heterogeneous data with database middle-ware:beyond integration. Haas L M,Miller R J,Niswonger B,et al. IEEE Data EngineeringBulletin . 1999
[2]  
Automaticallyextracting structure from free text addresses. Borkar V,Deshmuk K,Sarawagi S. IEEE Transactions on Knowledge and Data Engineering . 2000
[3]  
Datainte-gration:where does the ti me go. Seligman L,Rosenthal A,Lehner P,et al. IEEE Data Engi-neering Bulletin . 2002
[4]  
Meta-data support fordata transformations using microsoft repository. Bernstein P,Bergstraesser T. IEEE Transactions on Knowledge and Data Engineering . 1999
[5]  
Specifying database trans-formationin WOL. Davidson S B,Kosky AS. IEEE Data Engineering Bulle-tin . 1999