学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
海量Web搜索引擎系统中用户行为的分布特征及其启示
被引:41
作者
:
王建勇
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系网络与分布式系统研究室!北京
王建勇
论文数:
引用数:
h-index:
机构:
单松巍
论文数:
引用数:
h-index:
机构:
雷鸣
论文数:
引用数:
h-index:
机构:
谢正茂
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系网络与分布式系统研究室!北京
李晓明
不详
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系网络与分布式系统研究室!北京
不详
机构
:
[1]
北京大学计算机科学技术系网络与分布式系统研究室!北京
[2]
北京大学计算机科学技术
来源
:
中国科学E辑:技术科学
|
2001年
/ 04期
关键词
:
万维网;
搜索引擎;
分布特征;
网页;
用户行为;
D O I
:
暂无
中图分类号
:
TP393.09 [];
学科分类号
:
080402 ;
摘要
:
统计分析了大规模搜索引擎系统的用户行为的分布特征 .结果表明 ,用户查询内容和URL点击表现出明显的局部性 ;用户查询的分布符合幂函数的特征并具有良好的自相似性 .基于上述规律 ,设计了查询cache ,比较了FIFO ,LRU及带衰减的LFU等 3种cache替换策略 .然后 ,基于用户行为考察了海量网页信息的分布特征 ,并利用URL的入度、镜像度、目录深度等网页参数与用户行为反馈后的相关度的方差分析 ,阐明了其对优化搜索引擎系统定序算法 (rankingalgorithm)的启示 .
引用
收藏
页码:372 / 384
页数:13
相关论文
共 2 条
[1]
网络交通自相似特性的分析及应用——具有单一登录点的机群网络服务器的性能评测
论文数:
引用数:
h-index:
机构:
赵晓芳
论文数:
引用数:
h-index:
机构:
刘欣
徐志伟
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
徐志伟
[J].
计算机研究与发展,
1999,
(09)
: 1032
-
1038
[2]
Salton,G.,McGill,M.J. Introduction to Modern Information Retrieval . 1983
←
1
→
共 2 条
[1]
网络交通自相似特性的分析及应用——具有单一登录点的机群网络服务器的性能评测
论文数:
引用数:
h-index:
机构:
赵晓芳
论文数:
引用数:
h-index:
机构:
刘欣
徐志伟
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
徐志伟
[J].
计算机研究与发展,
1999,
(09)
: 1032
-
1038
[2]
Salton,G.,McGill,M.J. Introduction to Modern Information Retrieval . 1983
←
1
→