搜索引擎用户访问量模型

被引:10
作者
王继民
彭波
不详
机构
[1] 北京大学计算机科学技术系网络实验室
[2] 北京大学计算机科学技术系网络实验室 北京
[3] 中科院资源环境科学信息中心
[4] 兰州
[5] 北京
关键词
搜索引擎; 用户访问量; 小波; 潜周期模型;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
基于大规模分布式WWW搜索引擎系统---北大“天网”的用户日志,该文研究了搜索引擎用户访问量建模分析和预测的一般方法;将用户的访问量看成按时间次序排列的随机变量序列,利用时间序列分析的方法,分别建立了天网用户的查询量、点击量和不同IP用户访问量的潜周期模型;结果显示模型对实际数据拟合效果较好;用户访问的主周期为24小时,其它周期依次为12小时、6小时、8小时、5小时、168小时(即一周);用户的异常访问情况可通过小波技术检测。
引用
收藏
页码:9 / 11+30 +30
页数:4
相关论文
共 4 条
[1]   海量Web搜索引擎系统中用户行为的分布特征及其启示 [J].
王建勇 ;
单松巍 ;
雷鸣 ;
谢正茂 ;
李晓明 .
中国科学E辑:技术科学, 2001, (04) :372-384
[2]  
搜索引擎与Web挖掘进展[M]. 高等教育出版社 , 李晓明, 2003
[3]  
应用时间序列分析[M]. 北京大学出版社 , 何书元编著, 2003
[4]  
Searchingtheweb:Thepublicandtheirqueries .2 ASpink,DWolfram,BJJansenetal. JournaloftheAmericanSocietyforInformationScience . 2001