随着互联网信息的快速增长,信息检索的应用越来越广泛。目前信息检索的方式大多采用基于关键字的匹配,然而这种方式无法解信息资源的内在含义和联系,导致检索结果的查全率、查准率都不高。针对这个问题,本文将本体的查询扩展与推理技术结合来改善检索的查全率、查准率和智能性。主要研究内容包括:
1.针对传统信息检索的不足,利用本体来描述领域概念之间的层次与关联。本文以旅游领域为研究题材,通过对领域内核心概念、关系的分析,利用本体论工程,构建了一个旅游领域本体。
2.提出了一个语义概念扩展算法。利用概念之间的层次关系,通过算法对概念对查询进行扩展,形成一个扩展后的概念集合,用来扩展用户的查询。采用这种方法可以提高查全率。
3.提出了一个结合语义扩展与推理的检索模型。将语义查询扩展与语义推理相结合,对用户的查询进行广度和深度的扩展。不仅提高了查全率、还提高了查准率。克服了传统检索的语义信息缺失问题,而且可以为用户提供智能化的信息查询。
4.最后设计和构建了一个基于本体的旅游信息查询系统:OTRS(Ontology Based Travel Research System)。采用文中提出的检索方法对用户的查询进行扩展与推理,结合Jena框架和推理机等技术,使用SPARQL查询语言对本体库中扩展和推理匹配之后的实例进行查询。通过对一些检索的返回结果的对比,得出了本文提出的检索方法的查全率、查准率和智能性都优于传统方法的结论。