半结构化数据集成技术研究

被引:0
作者
王瑞
机构
[1] 大庆石油学院
关键词
半结构化数据; 数据集成; XML; 结构化数据; 映射;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
近些年由于因特网和电子商务的发展,企业内部基于WEB和办公系统的信息量增长迅速,这些数据具有不确定的子类型和属性,包含复杂数据类型和复杂的引用关系,如WEB上的网页、各种文档等,我们称这些数据为半结构化数据。如何将这些半结构化数据同传统的结构化数据集成在一起,是当今一个重要的研究课题。其中,解决半结构化数据模型和结构化数据模型的集成,实现这两类数据的相互转换,是解决问题的关键。 针对此领域目前存在的不足,本文提出了一种基于XML的半结构化数据集成技术:即利用XML作为中间件来对半结构化数据进行集成。将半结构化数据集成分为相对独立且相互关联的两个部分:即半结构化数据模型的建立、半结构化数据模型与结构化数据模型之间的双向映射。其中半结构化数据模型的建立负责将半结构化数据进行规范化、抽取数据模式;半结构化数据模型与结构化数据模型间的双向映射负责通过映射算法将抽取而得的半结构化数据模型与结构化数据模型实现互转化,进而达到半结构化数据集成的目的。论文首先分析了半结构化数据的数据结构和XML的相关技术、基本内容和特点,提出一种将半结构化数据规范化的方法。阐述了XML与关系数据库的关系、建立XML数据与关系数据库间的转换机制。最后通过定义了RTD、MM和MT三个数据模型,结合实际项目对如何应用这些理论进行了阐述。 随着信息化的逐步推进和信息量的飞速膨胀,数据集成的范畴会越来越广,对各种数据进行集成的要求也会越来越迫切。论文的开题来源于大庆石油管理局实际的项目,因此具有重要的理论和实际价值。
引用
收藏
页数:70
共 26 条
[1]
利用OLE自动化和VBA的Delphi动态报表的研究与实现 [D]. 
李佐斌 .
武汉理工大学,
2006
[2]
半结构化数据XML与结构化数据库之间转换的研究及应用 [D]. 
陈明 .
重庆大学,
2004
[3]
基于XML的Web报表生成系统的研究与实现 [D]. 
周海河 .
昆明理工大学,
2003
[4]
一种Excel数据到结构化数据的转换方法 [J].
文必龙 ;
王瑞 ;
姚建蓬 ;
黄俊莲 .
佳木斯大学学报(自然科学版), 2006, (03) :365-367
[5]
基于XML Schema的XML与数据库转换技术研究 [J].
姜岩 ;
潘平 ;
王国仁 .
沈阳工业大学学报, 2006, (03) :307-310
[6]
基于OEM模型的半结构化数据的模式抽取 [J].
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2004, (09) :1264-1267
[7]
一种多自治域层次互操作模型的系统框架 [J].
李瑞轩 ;
卢正鼎 ;
吴炜 ;
文珠穆 ;
不详 .
计算机工程与应用 , 2004, (27) :157-159+199
[8]
HTML数据内容的抽取与集成 [J].
欧建雄 ;
张礼平 .
华东理工大学学报, 2003, (06) :613-616
[9]
基于XML的数据模型在报表模块上的应用 [J].
方伟 ;
左春 ;
孙玉芳 ;
不详 .
计算机工程与应用 , 2003, (30) :197-200
[10]
通用报表的XML描述 [J].
晋玉星 ;
马骏 .
航空计算技术, 2003, (03) :62-65