海量Web搜索引擎系统中用户行为的分布特征及其启示

被引:41
作者
王建勇
单松巍
雷鸣
谢正茂
李晓明
不详
机构
[1] 北京大学计算机科学技术系网络与分布式系统研究室!北京
[2] 北京大学计算机科学技术
关键词
万维网; 搜索引擎; 分布特征; 网页; 用户行为;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
统计分析了大规模搜索引擎系统的用户行为的分布特征 .结果表明 ,用户查询内容和URL点击表现出明显的局部性 ;用户查询的分布符合幂函数的特征并具有良好的自相似性 .基于上述规律 ,设计了查询cache ,比较了FIFO ,LRU及带衰减的LFU等 3种cache替换策略 .然后 ,基于用户行为考察了海量网页信息的分布特征 ,并利用URL的入度、镜像度、目录深度等网页参数与用户行为反馈后的相关度的方差分析 ,阐明了其对优化搜索引擎系统定序算法 (rankingalgorithm)的启示 .
引用
收藏
页码:372 / 384
页数:13
相关论文
共 2 条