基于日志挖掘的搜索引擎用户行为分析

被引:32
作者
岑荣伟
刘奕群
张敏
茹立云
马少平
机构
[1] 智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机科学与技术系
基金
高等学校博士学科点专项科研基金;
关键词
计算机应用; 中文信息处理; 用户行为分析; 搜索引擎; 网络信息检索;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。
引用
收藏
页码:49 / 54
页数:6
相关论文
共 3 条
  • [1] 基于用户行为分析的搜索引擎自动性能评价
    刘奕群
    岑荣伟
    张敏
    茹立云
    马少平
    [J]. 软件学报, 2008, (11) : 3023 - 3032
  • [2] 基于大规模日志分析的搜索引擎用户行为分析
    余慧佳
    刘奕群
    张敏
    茹立云
    马少平
    [J]. 中文信息学报, 2007, (01) : 109 - 114
  • [3] Which way now? Analysing and easing inadequacies in WWW navigation
    Cockburn, A
    Jones, S
    [J]. INTERNATIONAL JOURNAL OF HUMAN-COMPUTER STUDIES, 1996, 45 (01) : 105 - 129