基于python的网络爬虫技术研究

被引:20
作者
李玉香 [1 ]
王孟玉 [1 ]
涂宇晰 [1 ,2 ]
机构
[1] 河北科技师范学院
[2] 中国石油化工股份有限公司河北秦皇岛石油分公司
关键词
python; 网络爬虫技术; 数据提取与处理; 研究;
D O I
暂无
中图分类号
TP312.1 []; TP393.092 [];
学科分类号
081202 ; 0835 ; 080402 ;
摘要
随着互联网信息技术的快速发展,越来越多用户借助于网络搜索、在线浏览等平台,进行所需要数据信息的获取,而最常用的信息获取方式为网络爬虫。网络爬虫又被称为网络机器人,其主要利用Python程序设计语言,对浏览器网页中的HTTP超文本协议、URL地址等进行访问与爬取,不需要人为的干预或操作,就能够完成网站中数据信息的自动爬取。本文主要探讨python网络爬虫技术的主要内容,及其对网页数据爬取、永久保存的实现流程。
引用
收藏
页码:143 / 145
页数:3
相关论文
共 4 条
[1]   正则表达式在python爬虫中的应用 [J].
苻玲美 .
电脑知识与技术, 2019, 15 (25) :253-254
[2]   基于Python的辅助教学系统 [J].
李军红 .
电子技术与软件工程, 2019, (17) :51-52
[3]   基于Python的网络爬虫系统的设计与实现 [J].
李琳 .
信息通信, 2017, (09) :26-27
[4]   基于Python的网络爬虫技术 [J].
钱程 ;
阳小兰 ;
朱福喜 .
黑龙江科技信息, 2016, (36) :273-273