基于主题词对的文档重排方法

被引:6
作者
何婷婷
许婷
瞿国忠
涂新辉
机构
[1] 华中师范大学计算机科学系
[2] 教育部教育信息技术工程研究中心
关键词
主题词对; 概率潜在语义索引; 文档重排;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%。
引用
收藏
页码:161 / 163
页数:3
相关论文
empty
未找到相关数据