基于历史点击数据的集合选择方法

被引:2
作者
刘颖 [1 ]
陈岭 [1 ]
陈根才 [1 ]
赵江奇 [2 ]
王敬昌 [2 ]
机构
[1] 浙江大学计算机科学与技术学院
[2] 浙江鸿程计算机系统有限公司
关键词
分布式信息检索; 集合选择; 相似查询; 点击数据;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合.
引用
收藏
页码:23 / 28+161 +161
页数:7
相关论文
共 1 条