智能搜索引擎中的同义词识别算法研究

被引:0
作者
朱毅华
机构
[1] 南京农业大学
关键词
智能搜索引擎,关键词,信息检索,概念检索, 同义词识别,词素,相似度算法,语义词典;
D O I
暂无
年度学位
2001
学位类型
硕士
导师
摘要
本文概述了对搜索引擎特别是中文搜索引擎的相关研究,分析了下一代 智能搜索引擎的功能特点,并尝试利用相似度算法实现智能搜索引擎中的概 念的识别。 关键词检索是大多数搜索引擎的主要检索手段,然而多数搜索引擎对此 不加控制。从情报语言学研究的成果以及网络信息检索的现状来看,自然语 言不加以控制,检索效率与效果是不能尽如人意的。应该说,要克服关键词 检索系统的弊病,必须对关键词进行有效的控制,变字面检索为概念检索。 本文在对字面相似度识别算法的深入分析基础上,提出了基于词素的语 义识别算法。该算法首先将复合词切分为词素,并在此基础上对词素进行语 义分解和标注来进行同义判别。其主要依据是,对标引关键词的切分统计表 明,专业领域中的大多数复合词可由数量有限的词素组配而成,通过建立一 个专业性的词素语义信息词典,可以将复合词切分为词素,再转换为事先设 计好的语义范畴代码,在相似度计算时以语义代码的比较代替字面的比较, 突破了以往字面相似度算法的一些局限。 通过与字面相似度算法进行对比测试,证明该算法具有相对较高的识别 率,对搜索引擎的概念检索有一定的应用价值。
引用
收藏
页数:60
共 23 条
[1]
网络信息检索用语言的发展趋势 [J].
张琪玉 .
图书馆杂志, 2001, (03) :5-7+22
[2]
网络信息检索工具增强关键词检索功能的措施 [J].
张琪玉 .
图书馆杂志, 2001, (01) :7-10
[3]
用户搜索请求中限定成分的识别及提取 [J].
闫琪 ;
张志伟 ;
宁洪 .
计算机工程与科学, 2000, (03) :57-59+68
[4]
中文搜索引擎概念检索初探 [J].
李蕾 ;
王楠 ;
张剑 ;
钟义信 ;
郭祥昊 ;
贾自燕 .
计算机工程与应用, 2000, (06) :1-3+11
[5]
中文智能搜索引擎:思路、设计与系统 [J].
陈敏 .
软件世界, 2000, (05) :60-62
[6]
运用情报检索语言理论与方法完善搜索引擎的功能 [J].
曹东 ;
韩全惜 ;
庄军 .
情报理论与实践, 2000, (01) :58-61
[7]
网络搜索引擎的现状分析 [J].
翁惠玉 ;
马范援 ;
朱义军 ;
杨传厚 .
情报学报, 1999, (S1)
[8]
搜索引擎使用技术回顾和发展趋势探讨 [J].
卢世光 ;
丁方忠 .
广东通信技术, 1999, (05) :18-21
[9]
论搜索引擎的原理和检索特性 [J].
陆建平 .
图书馆杂志, 1999, (09) :20-27
[10]
基于Yahoo的信息自动分类器的原理与设计 [J].
杨清 ;
杨岳湘 ;
瞿国平 .
计算机工程与科学, 1999, (04)