基于用户日志的查询扩展统计模型

被引:58
作者
崔航
文继荣
李敏强
机构
[1] 天津大学系统工程研究所
[2] 微软亚洲研究院
关键词
信息检索; 查询扩展; 用户日志; 日志挖掘;
D O I
10.13328/j.cnki.jos.2003.09.013
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.
引用
收藏
页码:1593 / 1599
页数:7
相关论文
共 2 条