一种基于关键词的网页搜索结果多样化方法

被引:5
作者
林古立
彭宏
马千里
韦佳
覃姜维
机构
[1] 华南理工大学计算机科学与工程学院
基金
广东省自然科学基金; 中央高校基本科研业务费专项资金资助;
关键词
信息检索; 关键词; 检索结果; 多样化; 重排序;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
网页搜索结果的多样化已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素.文中将多样化问题形式化为信息面覆盖率的最大化问题,提出了一种基于关键词的网页搜索结果多样化方法KDM.该方法首先从与用户查询相关的结果文档中提取出可以描述结果文档所蕴含的信息面的关键词,然后根据关键词的同现性以及关键词对文档的描述能力,计算出结果文档的信息面新颖度,最后结合新颖度和相关度对文档进行重新排序,从而给用户提供多样化的搜索结果.实验结果表明,文中方法的多样化性能优于现有的其它多样化方法.
引用
收藏
页码:102 / 107
页数:6
相关论文
共 4 条
[1]  
Redundancy, diversity and interdependent document relevance[J] . Filip Radlinski,Paul N. Bennett,Ben Carterette,Thorsten Joachims.ACM SIGIR Forum . 2009 (2)
[2]  
Beyond binary relevance[J] . Paul N. Bennett,Ben Carterette,Olivier Chapelle,Thorsten Joachims.ACM SIGIR Forum . 2008 (2)
[3]  
The budgeted maximum coverage problem .2 S. Khuller,A. Moss,and J. Naor. Information Processing Letters . 1997
[4]  
On relevance as a measure .2 Goffman,W. Information Storage and Retrieval . 1964