基于搜索日志的用户行为分析

被引:5
作者
童国平
孙建军
机构
[1] 南京大学信息管理学院
关键词
搜索引擎日志; 查询日志; 用户行为分析; 日志挖掘;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
【目的】利用搜索引擎日志数据对用户查询行为特征进行分析。【方法】采用分词、统计分析、聚类分析、可视化等方法,分别从用户的查询串、查询方式、查询主题、查询点击行为和用户类型5个方面对用户使用搜索引擎时的行为特征进行分析。【结果】发现搜索用户偏好使用2-5个中文名词短语组成的查询串;更少使用口语化查询,不爱使用高级检索功能;查询用词变得多样化;查询时间存在高峰低谷;再次证实存在"翘尾现象"。【局限】使用的数据量不够大,没有结合用户详细信息进行分析。【结论】使用搜索引擎日志可以获得用户行为特征,并能为改善搜索引擎提供一些建议。
引用
收藏
页码:80 / 88
页数:9
相关论文
共 15 条
[1]   基于百度搜索日志的用户行为分析 [J].
董志安 ;
吕学强 .
计算机应用与软件, 2013, 30 (07) :17-20
[2]   低频查询的用户行为分析和类别研究 [J].
姚婷 ;
张敏 ;
刘奕群 ;
马少平 ;
茹立云 .
计算机研究与发展, 2012, 49 (11) :2368-2375
[3]   基于搜索引擎日志分析的网络舆情监测方法研究 [J].
唐涛 .
情报杂志 , 2012, (08) :27-30+26
[4]   网络日志中查询串语义关系挖掘及其应用研究 [J].
段建勇 ;
徐骥超 ;
张梅 .
现代图书情报技术, 2012, (01) :58-62
[5]   中文搜索引擎用户行为的演化分析 [J].
马少平 ;
刘奕群 ;
刘健 ;
张敏 ;
祝建华 ;
茹立云 .
中文信息学报, 2011, (06) :90-97
[6]   搜索引擎日志中“N+V”型主谓短语研究 [J].
赵红改 ;
肖诗斌 ;
王洪俊 ;
吕学强 .
中文信息学报, 2011, (05) :24-29
[7]   搜索引擎日志中“N1+N2”型名词短语研究 [J].
刘志杰 ;
吕学强 ;
程涛 .
现代图书情报技术, 2010, (12) :58-63
[8]   基于日志挖掘的搜索引擎用户行为分析 [J].
岑荣伟 ;
刘奕群 ;
张敏 ;
茹立云 ;
马少平 .
中文信息学报, 2010, (03) :49-54
[9]   搜索引擎查询日志的词性标注和挖掘研究 [J].
赖茂生 ;
屈鹏 .
现代图书情报技术, 2009, (04) :50-56
[10]   基于大规模中文搜索引擎的搜索日志挖掘 [J].
陈红涛 ;
杨放春 ;
陈磊 .
计算机应用研究, 2008, (06) :1663-1665