一种基于上下文的中文信息检索查询扩展

被引:24
作者
贺宏朝
何丕廉
高剑峰
黄昌宁
机构
[1] 天津大学电子信息工程学院
[2] 微软(亚洲)研究院
[3] 微软(亚洲)研究院 天津
[4] 天津
[5] 北京
基金
天津市自然科学基金;
关键词
查询扩展; 基于上下文; 中文信息检索;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
在中文信息检索的研究和实践中 ,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来 ,这是影响检索效果的一个很关键的问题。查询扩展可以在一定程度上解决这种词的不匹配现象 ,然而 ,实验表明 ,通常简单的查询扩展并不能稳定地提高中文信息检索的检索效果。本论文中提出并实现了一种基于上下文的查询扩展方法 ,可以根据查询的上下文对扩展词进行选择 ,是一种相对“智能”的查询扩展方法。在TREC - 9中文信息检索测试集上进行的实验表明 ,相对于通常简单的查询扩展 ,基于上下文的查询扩展方法取得了具有统计意义提高的检索效果。
引用
收藏
页码:32 / 37+45 +45
页数:7
相关论文
empty
未找到相关数据