学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于流水线负载平衡模型的并行爬虫研究
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
孟祥乾
论文数:
引用数:
h-index:
机构:
叶允明
论文数:
引用数:
h-index:
机构:
邓斌
机构
:
[1]
哈尔滨工业大学深圳研究生院
来源
:
计算机工程
|
2009年
/ 35卷
/ 02期
关键词
:
爬虫;
并行;
流水线;
负载平衡;
D O I
:
暂无
中图分类号
:
TP311.52 [];
学科分类号
:
摘要
:
针对并行爬虫系统在多任务并发执行时所遇到的模块间负载平衡问题,提出流水线负载平衡模型(PLB),将不同的任务抽象为独立模块而达到各模块的处理速度相等,采用多线程的方式实现基于PLB的并行爬虫,根据线程的休眠和缓冲区的变化对线程数量进行动态调整以实现PLB。实验结果表明该方法具有良好的运行效率和稳定性。
引用
收藏
页码:34 / 36
页数:3
相关论文
共 2 条
[1]
一种高性能分布式Web Crawler的设计与实现
[J].
张岭
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
张岭
;
叶允明
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
叶允明
;
宋晖
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
宋晖
;
于水
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
于水
;
马范援
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
马范援
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
不详
.
上海交通大学学报 ,
2004,
(01)
:59
-61
[2]
分布式Web Crawler的研究:结构、算法和策略
[J].
叶允明
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海,上海
叶允明
;
于水
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海,上海
于水
;
论文数:
引用数:
h-index:
机构:
马范援
;
宋晖
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海,上海
宋晖
;
论文数:
引用数:
h-index:
机构:
张岭
.
电子学报,
2002,
(S1)
:2008
-2011
←
1
→
共 2 条
[1]
一种高性能分布式Web Crawler的设计与实现
[J].
张岭
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
张岭
;
叶允明
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
叶允明
;
宋晖
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
宋晖
;
于水
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
于水
;
马范援
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
马范援
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
不详
.
上海交通大学学报 ,
2004,
(01)
:59
-61
[2]
分布式Web Crawler的研究:结构、算法和策略
[J].
叶允明
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海,上海
叶允明
;
于水
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海,上海
于水
;
论文数:
引用数:
h-index:
机构:
马范援
;
宋晖
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海,上海
宋晖
;
论文数:
引用数:
h-index:
机构:
张岭
.
电子学报,
2002,
(S1)
:2008
-2011
←
1
→