分布式网络爬虫的设计与实现

被引:11
作者
吴黎兵 [1 ,2 ]
柯亚林 [1 ,2 ]
何炎祥 [1 ,2 ]
刘楠 [2 ]
机构
[1] 武汉大学计算机学院
[2] 信息网络安全公安部重点实验室
关键词
DSpider; 系统架构; 节点协同; Web划分;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
提出一种可部署于单一网域及多网域间的分布式爬虫DSpider。DSpider能够通过调整节点规模和连接超时阈值,有效部署于LAN和WAN两种网络环境中。首先简要介绍了DSpider的系统结构,然后详细分析了DSpider的任务调度策略,并且在实验中将DSpider爬虫部署在LAN和WAN两种环境中的不同性能作了详细的分析。
引用
收藏
页码:176 / 179+213 +213
页数:5
相关论文
共 1 条
[1]   分布式Web Crawler的研究:结构、算法和策略 [J].
叶允明 ;
于水 ;
马范援 ;
宋晖 ;
张岭 .
电子学报, 2002, (S1) :2008-2011