信息检索技术在处理网上爆炸性增长的信息资源时显得尤为重要,它已是许多网上系统不可或缺的一项功能,但是目前这种基于字符串匹配的关键字检索技术,往往得不到让人满意的检索结果,无法满足用户的需求。
以目前的网上医药查询系统为例,用户希望通过检索能够找到相应症状的一些信息,但总会返回完全无关、相关度不高或者遗漏了很多相关信息的结果!推出高质高效的检索技术已经成为全世界范围的研究重点和热点。
语义Web的提出和发展为语义检索的实现开辟了一条崭新的思路。在信息检索研究领域,语义检索涉及到众多概念和实体,如Ontology、受控词表、语义Web等。语义检索所包含的技术很多,故难以在本篇论文中面面俱到。本文在总结语义Web和语义检索研究现状的基础上,首先研究了在语义Web环境下实现语义检索的机理和相关支撑技术;然后着重研究了语义Web结构中的关键两层:ontology和语义Web描述语言——OWL,特别探讨了ontology的内涵和外延及其在语义检索系统中所起到的作用,详细介绍了语义Web描述语言的结构和语法;最后研究了惠普实验室开发的语义Web应用系统开发工具Jena以及语义检索语言SPARQL在实现语义检索系统中的作用,并选择了“医药搜寻系统”作为语义检索技术的应用对象,通过给计算机一种“医学知识”,然后在此基础上构建一个实验检索系统,用于证明构建于本体上的检索方法和工具在查全率和查准率上都将有质的飞跃。
本文的研究围绕着语义检索和语义Web,以语义检索系统的实现为目标,对相关的理论、方法和技术进行了充分的研究和探讨。