基于本体的语义信息检索研究

被引:0
作者
王进
机构
[1] 中国科学技术大学
关键词
本体; 语义信息检索; 查询语义扩展; 语义聚类; 频繁语义序列;
D O I
暂无
年度学位
2006
学位类型
博士
摘要
随着Internet的爆炸性增长,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大动态信息服务网络,为用户提供了一个极具价值的信息源。而传统的信息检索技术不能对这些信息提供语义级的组织、理解以及处理等更能满足用户需求的服务,寻找新的方法成为目前研究的热点。 在现有语义检索方法的基础上,本文针对基于本体的语义信息检索进行了深入的研究,以本体为依据,提出了一种新的语义检索模型,并对该模型涉及的用户查询、文档预处理、语义检索以及检索结果优化等方面,从系统的角度对其中的主要问题进行了分析和研究,主要贡献有: 1.提出了一种基于本体的查询语义扩展方法。 针对现有查询扩展策略缺乏有效的语义处理机制问题,在深入分析现有基于本体概念的查询扩展策略基础上,提出了三种用户查询的语义模式,以及相应的用户查询扩展的方法。该方法利用本体概念连通图以及单词的概念扩展算法对用户查询进行语义扩展,为基于语义的信息检索提供了新的思路。 2.提出了一种基于本体的文档语义标注和语义聚类方法。 针对语义检索中文档表示问题以及文档聚类的语义质心划分问题,提出了一种对文档进行语义标注和向量化处理,以及利用概念连通图中的节点权重进行语义聚类质心划分的方法。该方法在对文档进行语义预处理,并利用文档的实例抽取分析进行语义标注的基础上,为文档建立语义特征向量,并以此为依据对文档进行语义聚类,为文档的组织提供了有效的语义级管理手段。 3.提出了一种基于本体的语义信息检索模型。 针对传统向量空间模型在语义处理方面的缺陷,提出了一种基于本体的语义信启、检索模型,从语义项权重的设计、不同关键字之间的语义关系体现,以及语义特征向量间的相似度计算策略等方面进行了研究。在模型中,通过概念连通图对不同语义项之间的关系进行了重新考量,并将语义相似度的计算分为概念相似度和属性相似度两个方面,综合考虑了二者在语义检索中的作用,改善了检索效果。 4.设计了一种基于频繁语义序列模式挖掘的检索结果优化方法。
引用
收藏
页数:131
共 20 条
[1]
基于本体的信息检索模型研究 [J].
宋峻峰 ;
张维明 ;
肖卫东 ;
唐九阳 .
南京大学学报(自然科学版), 2005, (02) :189-197
[2]
基于语义关系查询扩展的文档重构方法 [J].
张敏 ;
宋睿华 ;
马少平 .
计算机学报, 2004, (10) :1395-1401
[3]
一种基于潜在语义分析的查询扩展算法 [J].
顾榕 ;
王小平 ;
曹立明 ;
不详 .
计算机工程与应用 , 2004, (18) :23-25+63
[4]
基于本体的跨语言信息检索模型 [J].
王进 ;
陈恩红 ;
张振亚 ;
王煦法 .
中文信息学报, 2004, (03) :1-8+60
[5]
自动标引中基于概念层次树的主题词轮排选择的算法实现 [J].
马颖华 ;
王永成 ;
苏贵洋 ;
韩客松 ;
赵海 .
高技术通讯, 2003, (06) :18-21
[6]
Semantic Web与基于语义的网络信息检索 [J].
张晓林 .
情报学报, 2002, (04) :413-420
[7]
基于Bayes潜在语义模型的半监督Web挖掘 [J].
宫秀军 ;
史忠植 .
软件学报, 2002, (08) :1508-1514
[8]
一种基于向量空间模型的多层次文本分类方法 [J].
刘少辉 ;
董明楷 ;
张海俊 ;
李蓉 ;
史忠植 .
中文信息学报, 2002, (03) :8-14+26
[9]
基于概念空间的文本语义索引 [J].
李源 ;
郑毅 ;
何清 ;
史忠植 .
计算机科学, 2002, (01) :20-22
[10]
基于本体论和多主体的信息检索服务器 [J].
武成岗 ;
焦文品 ;
田启家 ;
史忠植 .
计算机研究与发展, 2001, (06) :641-647