基于本体的异构数据集成系统的研究与实现

被引:0
作者
杨丽丽
机构
[1] 西北农林科技大学
关键词
数据集成; 语义异构; 本体; SPARQL;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
近年来,许多大型企业和机构内部数据量与信息量日益增加,这些数据越来越呈现出异构性、分布性等特点,随着信息化建设步伐的加快,对这些异构数据进行集成、共享的要求越来越迫切。本文以异构数据源为研究对象,建立了异构数据集成系统体系架构模型,研究了全局本体的构建方法,改进了构建局部本体的方法,改进了全局查询分解算法和查询转换算法,针对某高校学科建设需要开发了基于本体的异构数据集成原型系统。该系统集成了学科建设涉及到的三个异构数据源,为用户以统一的方式访问数据资源提供了有效的途径。主要研究内容和结论如下: (1)以构建全局本体和局部本体为目标,研究了本体构建的问题,改进了基于关系数据库抽取本体规则以及基于XML文件抽取本体规则的方法。本文中涉及到的数据源有结构化的关系数据库MySQL、Oracle,半结构化的数据文件XML,对这三种不同形式的数据源采用不同的构建原则构建了其局部本体语义模型。在领域专家的参与下,针对全局应用构建了全局本体语义模型。最后采用Protégé本体建模工具建立全局本体模型和局部本体模型。 (2)在构建出全局本体和局部本体的基础上,采用手动建立本体映射规则的方法,分别构建了全局本体到局部本体之间以及局部本体到数据源之间的映射信息,为查询分解和查询转换提供支持。在全局本体到局部本体的映射信息建立中,将全局本体的类、数据类型关联和个体关联映射到每个局部本体对应的类、数据类型和个体关联;在局部本体到数据源的映射信息建立中,将局部本体中的类、数据类型关联和个体关联映射到关系数据库的表、属性和外键。 (3)研究了查询转换问题,改进了查询分解算法和查询转换算法。使用查询分解算法先将对全局查询的SPARQL语句分解为对局部本体的SPARQL语句,再使用查询转换算法将对局部本体的SPARQL语句转换为对数据源的SQL语句。 (4)以某高校学科信息领域内的异构数据为背景,开发了基于本体的异构数据集成原型系统。实现了异构数据的有效整合,为用户提供了查询接口,使用户能够以统一的方式同时访问各个数据源的信息。
引用
收藏
页数:57
共 24 条
[1]
本体方法及其应用.[M].甘健侯; 姜跃; 夏幼明; 著.科学出版社.2011,
[2]
DartGrid.[M].陈华钧; 姜晓红; 吴朝晖; 著.浙江大学出版社.2011,
[3]
XML编程与应用教程.[M].孙更新; 肖冰; 彭玉忠; 编著.清华大学出版社.2010,
[4]
数据库系统概论.[M].王珊;萨师煊[著];.高等教育出版社.2006,
[5]
多数据库系统原理与技术.[M].李瑞轩;卢正鼎著;.电子工业出版社.2005,
[6]
Web服务实用技术教程.[M].(美)H.M.Deitel等著;励志等译;.机械工业出版社.2004,
[7]
语义网简明教程.[M].宋炜;张铭[著];.高等教育出版社.2004,
[8]
基于本体的异构数据集成技术研究与实现 [D]. 
郭鑫 .
中国航天第二研究院,
2008
[9]
基于SPARQL的分布式语义查询处理 [D]. 
唐晶明 .
浙江大学,
2007
[10]
Jena Tutorial...http://jena.sourceforge.net.2011,