低频查询的用户行为分析和类别研究

被引:9
作者
姚婷
张敏
刘奕群
马少平
茹立云
机构
[1] 智能技术与系统国家重点实验室
[2] 清华大学计算机科学与技术系
基金
高等学校博士学科点专项科研基金;
关键词
低频查询; 用户行为; 日志分析; 特征分析; 分类;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
低频查询是用户提交查询频次非常低的查询.它们占了搜索引擎独立查询的很大比例且对用户体验影响巨大,但由于数据稀疏性,现有的搜索引擎用户行为分析及相关研究中对低频查询涉及很少.结合前人的相关工作,使用商业搜索引擎的大规模用户日志,在会话级别上进行低频查询的用户行为分析以及类别研究.基于目标查询行为、后续相关查询行为、整体会话行为3个方面的12个特征进行了低频查询的用户行为特征分析,首次提出了低频查询类别分析框架,并进一步使用改进的AdaBoost算法对低频查询会话进行分类.实验对2000个随机的低频查询会话样例进行分类,AUC值达到了83%以上.低频查询的用户行为分析和类别研究,将为搜索引擎用户行为分析等网络检索研究提供重要基础.
引用
收藏
页码:2368 / 2375
页数:8
相关论文
共 3 条
[1]   基于用户行为分析的搜索引擎自动性能评价 [J].
刘奕群 ;
岑荣伟 ;
张敏 ;
茹立云 ;
马少平 .
软件学报, 2008, (11) :3023-3032
[2]  
A taxonomy of web search[J] . Andrei Broder.ACM SIGIR Forum . 2002 (2)
[3]  
Analysis of a very large web search engine query log[J] . Craig Silverstein,Hannes Marais,Monika Henzinger,Michael Moricz.ACM SIGIR Forum . 1999 (1)