基于大规模日志分析的搜索引擎用户行为分析

被引:113
作者
余慧佳 [1 ]
刘奕群 [1 ]
张敏 [1 ]
茹立云 [2 ]
马少平 [1 ]
机构
[1] 清华大学智能技术与系统国家重点实验室
[2] 搜狗公司研发中心
关键词
计算机应用; 中文信息处理; 网络信息检索; 搜索引擎; 用户行为分析; 点击信息分析;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5 000万条查询日志进行了分析。我们从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义。
引用
收藏
页码:109 / 114
页数:6
相关论文
共 12 条
  • [1] How people revisitweb pages:Empirical findings and implications for thedesign of history systems. Tauscher,L,&Greenberg,S. International Journal ofHuman-Computer Studies . 1997
  • [2] CharacterizingBrowsing Strategies in the World-Wide Web. Catledge,L.D,&Pitkow,J.E. Computer Networks . 1995
  • [3] Donna Harman.Overview ofTREC 2001. Ellen M.Voorhees. Proceedings of the tenth Text Retriev-al Conference . 2002
  • [4] Overview of TREC 2002.E.M. Ellen M.Voorhees. Pro-ceedings of the eleventh Text Retrieval Conference . 2003
  • [5] Overview of theTREC-2003 web track. D.Hawking,and N.Craswell. Proceedings of the twelfth Text Retrieval Confer-ence . 2004
  • [6] Overview of theTREC-2002 web track. D.Hawking,and N.Craswell. Proceedings of the elev-enth Text Retrieval Conference . 2003
  • [7] Monika Henzinger,Hannes Marais,et al.Analysis of a very large Web search engine querylog. Craig Silverstein. In SIGIR Forum,fall . 1998
  • [8] Open Directory Project. http://www.dmoz.org .
  • [9] Search Engine Sizes.In search enginewatch website. Danny Sullivan. http://searchenginewatch.com/re-ports/article.php/2156481 .
  • [10] A taxonomy of web search. Andrei Broder. SIGIR Forum . 2002