近些年来,随着网络技术的日臻成熟,网络已经深入到了人们生活的每一个角落,数字图书馆提供的信息共享越来越受到人们的重视。同时,网络的发展,也为数字图书馆带来了新的机遇。传统数字图书馆信息检索存在的问题日益显露,如数据的分布性、异构性,系统无法识别用户的真正检索意图,导致信息检索效率低下,造成漏检和误检,返回结果常常不能使用户满意等。语义网技术的出现,为改善数字图书馆信息检索性能提供了可能。本文正是应这种需求,依据语义网理论,结合数字图书馆检索现状,对基于语义网的数字图书馆信息检索进行了深入研究。
本文首先介绍了数字图书馆信息检索和语义网的相关概念与技术,分析数字图书馆信息检索面临的问题。在原有数字图书馆信息检索模型的基础上,构建了一种基于语义网的数字图书馆信息检索模型,并对该模型的三大模块及其功能进行详细阐述,探讨了该模型的体系结构。该模型将语义网技术应用于数字图书馆信息检索中,利用本体概念间的各种语义关系指导数字图书馆语义层次的信息检索过程,可解决检索系统只能从句法上对关键字进行分析,无法根据信息资源中的语义关系进行检索的问题,使用户能够快速、准确地找到所需要的资源,提高数字图书馆信息检索的查全率和查准率。
本文对基于语义网的数字图书馆信息检索涉及的关键问题进行了深入分析和研究。详细分析了数字图书馆信息检索领域本体的集成和构建方法。研究了基于三种不同视角的语义相似度计算方法。在基于语义距离的相似度算法中,综合考虑节点深度和节点所处层级地位因素,进行了改进;在基于概念特征的相似度算法中,依据实际需要,做出改进;融合基于信息量的相似度算法,最终提出了相应的语义相似度计算模型。该研究为基于语义网的数字图书馆信息检索的实现提供了一定的理论支持。