两种对URL的散列效果很好的函数

被引:44
作者
李晓明
凤旺森
机构
[1] 北京大学计算机科学技术系
关键词
散列; ELFhash; URL; 均匀分布; Web挖掘; 负载平衡;
D O I
10.13328/j.cnki.jos.2004.02.003
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列操作.针对两种典型的应用场合,即Web结构分析中的信息查询和并行搜索引擎中的负载平衡,基于一个含有2 000多万个URL的序列,进行了大规模的实验评测.说明在许多文献中推荐的对字符串散列效果很好的ELFhash函数对URL的散列效果并不好,同时推荐了两种对URL散列效果很好的函数.
引用
收藏
页码:179 / 184
页数:6
相关论文
empty
未找到相关数据