基于互联网的异构数据源集成的研究与实现

被引:0
作者
邓莎莎
机构
[1] 中南大学
关键词
数据集成; Web数据; 异构数据源;
D O I
暂无
年度学位
2005
学位类型
硕士
导师
摘要
随着Internet及其相:关技术的飞速发展,企业信息化的要求越来越迫切,其中一个很重要的方面就是企业数据的管理。如何获取异构环境中的有用数据并加以综合利用,即构建异构数据集成系统,成为一个引起广泛关注的研究领域。本文在综合分析目前异构数据集成理论和方法的基础上,着重研究了系统实现中关键问题。 论文首先提出异构数据集成模型。模型的抽取过程采用的是一种由用户的需要和期望驱动的集成方法。当数据源“插入”系统时并不立刻抽取数据,而只是在元数据库中存储数据源的描述信息。同时,它集成了所有可以提供JDBC/ODBC接口的数据库以及未来可以提供JOLAP接口的数据仓库、各种普通使用文件系统和Web数据。 接着,设计并实现了异构数据库系统和文件系统数据集成模块,并提供了一个统一的数据访问接口,极大地提高了系统的集成能力。 然后,在提出的关于Web数据集成的3点研究假设前提下,探讨了基于规则树的Wrapper生成流程。它包括预处理、生成HTML树、生成模式树、获取映射规则、生成规则树、修复规则树和执行Wrapper。考虑到Web站点经常发生变化,研究了Wrapper维护的流程。它包括识别数据特征、定义语义块和修复规则树。通过对试验数据的分析,证明该方法合适Web数据的抽取。 最后,对异构数据集成系统实现中的研究开发工作进行了总结,并阐述了将来进一步的研究工作。
引用
收藏
页数:68
共 16 条
[1]
Java数据库应用程序编程指南.[M].(美)KevinMukhar等著;魏海萍等译;.电子工业出版社.2002,
[2]
GKD-BASE PL/SQL引擎实现关键技术研究 [J].
唐扬 ;
熊伟 ;
陈宏盛 ;
景宁 .
电子技术应用, 2004, (08) :21-23
[3]
基于XML技术的Web数据集成模型研究 [J].
张金隆 ;
李魁 ;
鲍玉昆 ;
曾宇容 ;
不详 .
计算机工程与应用 , 2004, (14) :181-183+186
[4]
基于元数据的数据仓库安全性探讨 [J].
马艳锋 ;
孟祥武 .
计算机应用研究, 2004, (04) :100-101+176
[5]
集成Web数据的系统框架与实现方法 [J].
卢正鼎 ;
张素智 .
小型微型计算机系统, 2003, (10) :1759-1763
[6]
数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[7]
Web数据库技术简述 [J].
张志强 ;
周立柱 ;
冯建华 .
计算机科学, 2001, (10) :1-6
[8]
异构数据源的集成技术 [J].
谢鸿强 ;
董逸生 .
工业控制计算机, 2001, (06) :1-6
[9]
XML与Web数据集成及技术实现 [J].
周彦晖 ;
邹显春 ;
张为群 .
西南师范大学学报(自然科学版), 2001, (03) :255-259
[10]
Web内容抽取及其数据管理方法 [J].
张成洪 ;
肖军建 ;
张诚 .
复旦学报(自然科学版), 2001, (02) :177-183