基于领域本体的Web语义信息检索研究

被引:0
作者
张功亮
机构
[1] 广西师范大学
关键词
语义相关; 领域本体; 相关度; 概念格; 搜索引擎; 相关搜索;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
随着网络和信息技术的飞速发展,搜索引擎作为主要的互联网信息检索工具,使用频率变得越来越高。在网络用户想要精确查找所需的信息过程中,用户的检索目标并不是很明确,然而现有的大多数传统的搜索引擎采用基于关键字匹配的检索技术,返回的检索结果中出现许多无关信息和漏检的情况,查全率和查准率较低。如何提高搜索引擎的语义处理能力,准确的理解用户的检索目的成为了研究的一个热点和难点 词语的语义相关度表示两个词语间相互关联的程度,侧重于反映词语间的组合特点而不是聚合特点。词语语义相关度的研究已经广泛的运用于自然语言处理领域,在信息检索中的歧义消除,查询扩展,提高信息检索的正确率和召回率等方面都有着重要的应用价值。在搜索引擎检索技术中引入词语语义相关度目的是为了提高搜索引擎的语义处理能力,从而提高搜索引擎的智能性以及检索效率。 本文以旅游领域为背景,在基于旅游本体的旅游信息搜索引擎基础上,将领域本体中基于概念格的词语语义相关度计算应用到检索技术中,使得搜索引擎通过对语义的理解以及词语相关度计算将一些在语法上无关而在语义上相关的关键词推荐给用户,为用户明确检索目的提供参考。实现了该引擎中的相关搜索功能。 本文所完成的主要工作有: (1)介绍本体的基础知识,将领域本体引入到搜索引擎中。重点介绍和分析领域本体的组成结构、OWL2本体描述语言以及本体的构建方法。结合Web旅游信息的特点,根据搜索引擎的设计需求采用本体构建工具Protege按照七步法构建了一个旅游资源本体。 (2)研究了汉语词语语义相关度及其算法,分析了语义相关度计算的实现及引用。 (3)提出了一种在领域本体中基于概念格的语义相关度计算方法,该方法利用领域本体在知识描述、语义关系及其推理机制的优势和概念格对知识进行聚类的结构特点。通过实验证明,该方法计算相关度是可行、有效的。 (4)将该方法应用到基于旅游本体搜索引擎系统中,为该系统提供了相关搜索功能。
引用
收藏
页数:77
共 17 条
[1]
Scalability in Formal Concept Analysis.[J].RichardCole;Peter W.Eklund.Computational Intelligence.2002, 1
[2]
语义网简明教程.[M].宋炜;张铭[著];.高等教育出版社.2004,
[3]
HNC(概念层次网络)理论.[M].黄曾阳著;.清华大学出版社.1998,
[4]
基于概念格的语义相关度计算 [J].
张柯 ;
沈夏炯 ;
董鑫 ;
于俊洋 .
郑州轻工业学院学报(自然科学版), 2007, (自然科学版) :178-181
[5]
领域本体的概念相似度计算 [J].
陈杰 ;
蒋祖华 .
计算机工程与应用, 2006, (33) :163-166
[6]
本体论在Web信息检索中的应用 [J].
于江德 ;
樊孝忠 ;
汪涛 ;
顾益军 .
微电子学与计算机, 2006, (04) :160-161+165
[7]
细粒度语义网检索 [J].
吴刚 ;
唐杰 ;
李涓子 ;
王克宏 .
清华大学学报(自然科学版), 2005, (自然科学版) :1865-1872
[8]
基于HNC理论的语义相关度计算方法 [J].
张运良 ;
张全 .
计算机工程与应用, 2005, (34) :1-3+18
[9]
基于知网的语义相关度计算 [J].
许云 ;
樊孝忠 ;
张锋 .
北京理工大学学报, 2005, (05) :411-414
[10]
本体论研究综述 [J].
李善平 ;
尹奇韡 ;
胡玉杰 ;
郭鸣 ;
付相君 .
计算机研究与发展, 2004, (07) :1041-1052