目前导致信息检索质量低下的根本原因在于检索工具和检索过程缺乏语义化,对用户信息需求的理解,通常是基于语法层上简单的机械式的语法匹配,缺少语义理解能力,存在信息的误检、漏检等缺陷。本体是对客观存在的概念及其相互之间关系的描述,基于本体的信息检索是基于语义的检索,它弥补了传统关键词检索系统的不足。引入基于本体的语义信息检索技术,能使信息检索系统在信息查准率和查全率上有更好的保证。
本文首先阐述了基于本体的信息检索的国内外研究现状,概述了本体和信息检索的相关基础理论。并在分析、比较各种本体构建方法的基础上,遵循本体构建的一般原则,综合各种本体构建方法的优点,提出了一种新的领域本体构建模型,为构建基于本体的语义信息检索系统提供了有力的理论支持。
其次,从文档的语义预处理技术、语义相似度计算、语义查询扩展、倒排文件索引算法研究和语义推理等几个方面,对构建基于本体的语义检索所需的关键技术进行了深入地研究,并给出相应的改进算法。
再次,在上述理论研究的基础上,给出了一种基于本体论的科研论文检索模型,初步创建试验性数据结构论文本体,并通过测试,说明了文中方法的可行性和有效性。最后,对全文进行回顾、总结,指出不足,并对未来研究工作作出一些展望。