基于Python的专业网络爬虫的设计与实现

被引:32
作者
姜杉彪
黄凯林
卢昱江
张俊杰
曾志高
刘强
机构
[1] 湖南工业大学计算机与通信学院
关键词
Python; 网络爬虫; 数据挖掘; 搜索引擎;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
网络爬虫,又称网页蜘蛛、网络机器人。随着计算机技术的高速发展,互联网中的信息量越来越大,搜索引擎应运而生。传统的搜索引擎会有返回结果不精确等局限性。为了解决传统搜索引擎的局限性,专用型网络爬虫在互联网中越来越常见。同时,专用型网络爬虫具有专用性,可以根据制定的规则和特征,最后只体现和筛选出有用的信息。
引用
收藏
页码:17 / 19
页数:3
相关论文
共 3 条
[1]  
自己动手写网络爬虫.[M].罗刚; 王振东; 编著.清华大学出版社.2010,
[2]  
Python基础教程.[M].(挪) 赫特兰 (Hetland;M.L.) ; 著.人民邮电出版社.2010,
[3]   主题搜索引擎中网络爬虫的搜索策略研究 [J].
李勇 ;
韩亮 .
计算机工程与科学, 2008, (03) :4-6+56