基于本体的语义垂直搜索引擎研究

被引:0
作者
周源
机构
[1] 北京交通大学
关键词
垂直搜索引擎; 本体; OWL; Lucene; 查询扩展;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
搜索引擎作为获取因特网上海量信息的重要手段,是信息检索领域重要的研究课题,随着信息技术的不断发展,因特网上的信息量也与日剧增,内容庞大,组织松散。因此如何优化搜索引擎在该领域备受关注。垂直搜索引擎作为针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,通用搜索引擎的性质决定了其不能满足特殊领域,特殊人群的精确化信息需求服务。本文研究了本体和垂直搜索引擎技术,提出了一种基于本体的语义垂直搜索引擎,建立了语义查询扩展方法,并对Lucene原有结果排序算法进行优化。 本文研究了垂直搜搜引擎的基本概念和设计理论,本体相关知识以及其在信息检索方面的应用,分析了国内外搜索引擎的现状以及存在的不足,以及本体技术与垂直搜索引擎相结合的意义和必要性。在对目前主要的本体构建方法进行分析比较后,选用Protege3.4.5作为构建本体的编辑工具,OWL作为本体描述语言建立了一个数码产品领域本体。运用数码产品领域本体将用户的查询请求划分为本体类概念,本体实例,本体属性和普通查询,着重研究了本体实例和普通查询的扩展方法,对于本体实例从继承关联和路径关联两个方面进行扩展,对于普通查询采用基于词语共现的语义查询扩展方法,提出了一种基于本体适合垂直搜索引擎的语义查询扩展算法。为了克服Lucene原有结果排序算法只考虑关键词和网页相关度不能反映网页本身重要程度的缺点,提出引入基于链接分析的PageRank算法对其进行优化。 最后实现了基于本体的语义垂直搜索引擎原型DPOVSE,设计了相关实验,并与原有的查询方式和排序算法进行了实验对比分析。实验结果分析表明本文的研究内容可提高搜索引擎的查准率。
引用
收藏
页数:59
共 18 条
[1]
基于Lucene的数码产品垂直搜索引擎的设计与实现 [D]. 
殷卫霞 .
苏州大学,
2008
[2]
基于Lucene的搜索引擎技术的研究与改进 [D]. 
吴海明 .
暨南大学,
2006
[3]
PageRank算法的优化和改进 [J].
吴家麒 ;
谭永基 .
计算机工程与应用 , 2009, (16) :56-59
[4]
[5]
语义搜索研究综述 [J].
文坤梅 ;
卢正鼎 ;
孙小林 ;
李瑞轩 .
计算机科学, 2008, (05) :1-4
[6]
基于语义的垂直搜索引擎的研究 [J].
郑伟 ;
于双元 .
计算机时代, 2007, (12) :9-11
[7]
领域本体构建方法的研究 [J].
刘琳娜 ;
薛建武 ;
汪小梅 .
情报杂志 , 2007, (04) :14-16
[8]
一种基于局部共现的查询扩展方法 [J].
丁国栋 ;
白硕 ;
王斌 .
中文信息学报, 2006, (03) :84-91
[9]
浅析搜索引擎的原理及发展前景 [J].
岳清 .
大众科技, 2005, (05) :58-60
[10]
基于语义关系查询扩展的文档重构方法 [J].
张敏 ;
宋睿华 ;
马少平 .
计算机学报, 2004, (10) :1395-1401