一种改进的Lucene语义相似度检索算法

被引:13
作者
黄承慧 [1 ,2 ]
印鉴 [1 ]
陆寄远 [2 ]
机构
[1] 中山大学信息科学与技术学院
[2] 广东金融学院计算机科学与技术系
基金
高等学校博士学科点专项科研基金; 广东省自然科学基金;
关键词
语义; 相似度; 信息检索; 算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。
引用
收藏
页码:11 / 15
页数:5
相关论文
共 6 条
[1]   基于Lucene的语义检索系统的设计和实现 [J].
蒋一峰 ;
王华 ;
张玉红 ;
黄少林 .
计算机工程与设计, 2008, (20) :5336-5337+5341
[2]   基于Lucene的语义检索系统 [J].
郑廷 ;
郑诚 .
计算机工程, 2008, (16) :92-94
[3]   一种基于Lucene改进的全文检索工具包 [J].
宋佳 ;
诸云强 ;
刘润达 .
计算机工程与应用 , 2008, (04) :172-175
[4]   Lucene搜索引擎 [J].
周登朋 ;
谢康林 .
计算机工程, 2007, (18) :95-96+118
[5]   基于Lucene全文检索引擎的应用研究与实现 [J].
管建和 ;
甘剑峰 .
计算机工程与设计, 2007, (02) :489-491
[6]  
Lucene Java 3.0.1. Lucene. http://lucene.apache.org . 2010