基于python的网络爬虫技术研究

被引：20

作者：

李玉香 ^{[1
]}

王孟玉 ^{[1
]}

涂宇晰 ^{[1
,2
]}

机构：

[1] 河北科技师范学院

[2] 中国石油化工股份有限公司河北秦皇岛石油分公司

来源：

信息技术与信息化 | 2019年 / 12期

关键词：

python; 网络爬虫技术; 数据提取与处理; 研究;

D O I：

暂无

中图分类号：

TP312.1 []; TP393.092 [];

学科分类号：

081202 ; 0835 ; 080402 ;

摘要：

随着互联网信息技术的快速发展,越来越多用户借助于网络搜索、在线浏览等平台,进行所需要数据信息的获取,而最常用的信息获取方式为网络爬虫。网络爬虫又被称为网络机器人,其主要利用Python程序设计语言,对浏览器网页中的HTTP超文本协议、URL地址等进行访问与爬取,不需要人为的干预或操作,就能够完成网站中数据信息的自动爬取。本文主要探讨python网络爬虫技术的主要内容,及其对网页数据爬取、永久保存的实现流程。

引用

页码：143 / 145

页数：3