基于上下文的查询扩展

被引:31
作者
李卫疆 [1 ]
赵铁军 [2 ]
王宪刚 [2 ]
机构
[1] 昆明理工大学云南省计算机应用重点实验室
[2] 哈尔滨工业大学语言语音教育部-微软重点实验室
基金
国家自然科学基金重点项目;
关键词
信息检索; 查询扩展; 上下文; 语言模型; 伪反馈;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关系.在TREC信息检索测试集上进行的实验表明,相对于通常简单的语言模型,方法取得了5%~19%的提高.与流行的基于伪反馈的查询扩展方法相比,提出的方法也具有相当的平均准确率.
引用
收藏
页码:300 / 304
页数:5
相关论文
共 4 条
[1]   文本检索的统计语言建模方法综述 [J].
丁国栋 ;
白硕 ;
王斌 .
计算机研究与发展, 2006, (05) :769-776
[2]   一种基于局部共现的查询扩展方法 [J].
丁国栋 ;
白硕 ;
王斌 .
中文信息学报, 2006, (03) :84-91
[3]   基于语义关系查询扩展的文档重构方法 [J].
张敏 ;
宋睿华 ;
马少平 .
计算机学报, 2004, (10) :1395-1401
[4]   A cooccurrence-based thesaurus and two applications to information retrieval [J].
Schutze, H ;
Pedersen, JO .
INFORMATION PROCESSING & MANAGEMENT, 1997, 33 (03) :307-318