共 3 条
大数据环境下基于python的网络爬虫技术
被引:46
作者:
谢克武
机构:
[1] 重庆工商大学派斯学院软件工程学院
来源:
关键词:
网络爬虫;
python;
数据采集;
大数据;
D O I:
10.16589/j.cnki.cn11-3571/tn.2017.09.017
中图分类号:
TP391.3 [检索机];
学科分类号:
摘要:
随着互联网的发展壮大,网络数据呈爆炸式增长,传统搜索引擎已经不能满足人们对所需求数据的获取的需求,作为搜索引擎的抓取数据的重要组成部分,网络爬虫的作用十分重要,本文首先介绍了在大数据环境下网络爬虫的重要性,接着介绍了网络爬虫的概念,工作原理,工作流程,网页爬行策略,python在编写爬虫领域的优势,最后设计了一个通用网络爬虫的框架,介绍了框架中模块的相互协作完成数据抓取的过程。
引用
收藏
页码:44 / 45
页数:2
相关论文