学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
两种对URL的散列效果很好的函数
被引:44
作者
:
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
李晓明
凤旺森
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
凤旺森
机构
:
[1]
北京大学计算机科学技术系
来源
:
软件学报
|
2004年
/ 02期
关键词
:
散列;
ELFhash;
URL;
均匀分布;
Web挖掘;
负载平衡;
D O I
:
10.13328/j.cnki.jos.2004.02.003
中图分类号
:
TP393.09 [];
学科分类号
:
080402 ;
摘要
:
在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列操作.针对两种典型的应用场合,即Web结构分析中的信息查询和并行搜索引擎中的负载平衡,基于一个含有2 000多万个URL的序列,进行了大规模的实验评测.说明在许多文献中推荐的对字符串散列效果很好的ELFhash函数对URL的散列效果并不好,同时推荐了两种对URL散列效果很好的函数.
引用
收藏
页码:179 / 184
页数:6
相关论文
未找到相关数据
未找到相关数据