一种基于局部共现的查询扩展方法

被引:40
作者
丁国栋 [1 ]
白硕 [2 ]
王斌 [1 ]
机构
[1] 中国科学院计算技术研究所
[2] 上海证券交易所
关键词
计算机应用; 中文信息处理; 信息检索; 局部共现; 查询扩展; LOCOOC;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local ContextAnalysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。
引用
收藏
页码:84 / 91
页数:8
相关论文
共 2 条
  • [1] Improving the E ffectiveness of Inform ation Retrieval w ith Local Context Analysis. Xu J.X.and CroftW.B. ACM Transactions on Inform ation System s . 2000
  • [2] Improving Retrieval Feedback w ith Mu ltip leTerm-Rank ing Function Comb ination. C laud io Carp ineto,G iovann i Rom ano and V ittorio G iann in i. ACM Transactions on Inform ation System s . 2002