传统的信息查询技术基本上都是基于关键字的匹配,其查询性能不高,用户需要花费大量时间对查询结果进行再过滤,有时还找不到所需的信息。从TimBerners-Lee提出语义网的概念起,语义网的理论和技术就成为研究的热点。OWL被W3C推荐为标准的网络本体语言,具有良好的发展前景。本文研究的重点是基于OWL的语义查询技术。
本文首先对语义网的体系结构及其关键技术、本体、语义查询及其方法进行了基础性地研究;对OWL进行了系统地分析并对其语言规范进行了细致的分类。接着在对语义查询技术进行研究的基础上设计了一个基于OWL的语义查询模型。然后按照查询流程执行的先后顺序对每个模块进行了详细地设计说明。论文的主要研究工作如下:
(1)在模型的查询交互界面中加入了支持不同语言的语义匹配和查询的设计,可分别支持对不同语言进行语义匹配的查询和查询不同语言的文档。
(2)针对给出的is-a关系和equal-to关系两条语义推理扩展规则,讨论了其实现算法的设计思想,包括其数据结构的选择和设计。
(3)将查询对象分为关系数据库、语义数据库、有语义标注的网页和无语义标注的网页4种信息资源模式,分别讨论它们的语义查询的方法。并设计了一种对有语义标注(基于OWL本体进行标注)的网页进行语义查询的方法。
(4)通过研究,对已有的语义相关度的计算方法进行补充,给出了一种计算不同本体中的查询结果的语义相关度的方法。根据计算出的语义相关度,可以对查询结果进行排序并控制返回结果的条数。
(5)互不干扰、独立工作的传统查询引擎与语义查询引擎在模型中并存的设计,弥补了语义查询技术的不成熟。在查询交互界面加入了选择查询引擎的设计,控制两种查询引擎的工作。
最后,从实现技术和查询性能等方面分析了模型的可行性。