高性能网络爬虫:研究综述

被引:91
作者
周德懋
李舟军
机构
[1] 北京航空航天大学计算机学院
关键词
网络爬虫; 高性能; 可伸缩; 分布式;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
网络爬虫是一种自动下载网络资源的程序,是搜索引擎的基础构件之一。系统地介绍了网络爬虫的工作原理和发展现状,详细地阐述了一个高性能、可伸缩、分布式的网络爬虫的系统架构和所面临的关键问题。
引用
收藏
页码:26 / 29+53 +53
页数:5
相关论文
共 16 条