基于领域本体的用户查询词扩展方法的研究

被引:0
作者
张冰
机构
[1] 西华大学
关键词
搜索引擎; 领域本体; 领域相关词; 查询词扩展;
D O I
暂无
年度学位
2009
学位类型
硕士
摘要
查询词扩展技术作为一种提高信息检索精度的技术,被广泛应用到了搜索引擎中,并成为一个研究热点。本体是共享概念模型的明确地形式化规范说明,其中包含概念模型、明确、形式化、共享四层含义。由于本体可以被用来描述某个领域或者范围里的概念以及概念与概念之间的关系,使得这些信息在共享时具有大家共同认可的、明确的、唯一的定义,所以在信息检索中可以帮助人们在统一规范的信息系统中高效地检索到有用的信息。 为了更好地实现查询词扩展,本文结合了本体中信息的统一规范性以及层次关系明确等优点,提出了基于领域本体的查询词扩展方法。该方法在一定程度上克服了传统查询词扩展的语义性差、主题性差等缺点。 本文的主要研究内容归纳如下: 1.提出了一种基于领域本体的领域相关词抽取方法。本文基于Google网页目录建立了领域本体。把待抽取领域相关词的网页切词、分词,由这些词组成一个词集合,并且根据这些领域本体,从词集合中抽取符合给定阈值的领域相关词。这些领域相关词可以代表某一个或者某几个领域。将这些领域相关词填充到已建立的领域本体中,形成新的领域本体。实验表明使用本文方法抽取的领域相关词在表达文档上优于使用传统方法提取的关键词。 2.提出了基于形式概念分析的查询词扩展源的产生方法。使用大文本集作为形式背景建立概念格。在概念格中为用户查询词计算上近似概念以及下近似概念,并根据用户查询词及其上近似概念的属性和下近似概念的属性确定查询词扩展源。 3.提出了一种基于领域本体的查询词扩展方法。对查询词扩展源中的词与领域本体中的概念进行匹配计算,确定领域本体中的匹配概念和匹配属性,进而以匹配概念和匹配属性为核心建立子领域本体。实现用户查询词的领域泛化和细化,最终完成用户查询词的扩展。实验通过把本文方法的查询词扩展结果与其它搜索引擎的查询词扩展结果对比,表明了本文提出的方法是具有可行性的。
引用
收藏
页数:71
共 21 条
[1]
基于计算机自动分词的研究 [J].
李瑞芳 ;
孙健 ;
李娜 .
沈阳化工学院学报, 2008, (03) :255-259
[2]
语义查询扩展中词语-概念相关度的计算 [J].
田萱 ;
杜小勇 ;
李海华 .
软件学报, 2008, (08) :2043-2053
[3]
领域本体的构建实践 [J].
胡兆芹 ;
张士靖 .
医学信息学杂志, 2008, (01) :12-16
[4]
查询扩展技术进展与展望 [J].
黄名选 ;
严小卫 ;
张师超 .
计算机应用与软件, 2007, (11) :1-4+8
[5]
基于形式概念分析的领域本体构建方法研究 [J].
黄美丽 ;
刘宗田 .
计算机科学, 2006, (01) :210-212+239
[6]
学科领域知识本体建设方法研究 [J].
杜小勇 ;
马文峰 .
图书情报工作, 2005, (08) :74-78
[7]
本体论工程的比较研究 [J].
林平 ;
蒋祖华 .
计算机工程, 2005, (04) :6-8+110
[8]
基于用户日志的查询扩展统计模型 [J].
崔航 ;
文继荣 ;
李敏强 .
软件学报, 2003, (09) :1593-1599
[9]
Ontology方法学综述 [J].
杨秋芬 ;
陈跃新 .
计算机应用研究, 2002, (04) :5-7
[10]
基于形式概念分析的用户查询词扩展方法的研究 [D]. 
海宇峰 .
西华大学,
2007