共 4 条
基于python的网络爬虫技术研究
被引:20
作者:
李玉香
[1
]
王孟玉
[1
]
涂宇晰
[1
,2
]
机构:
[1] 河北科技师范学院
[2] 中国石油化工股份有限公司河北秦皇岛石油分公司
来源:
关键词:
python;
网络爬虫技术;
数据提取与处理;
研究;
D O I:
暂无
中图分类号:
TP312.1 [];
TP393.092 [];
学科分类号:
081202 ;
0835 ;
080402 ;
摘要:
随着互联网信息技术的快速发展,越来越多用户借助于网络搜索、在线浏览等平台,进行所需要数据信息的获取,而最常用的信息获取方式为网络爬虫。网络爬虫又被称为网络机器人,其主要利用Python程序设计语言,对浏览器网页中的HTTP超文本协议、URL地址等进行访问与爬取,不需要人为的干预或操作,就能够完成网站中数据信息的自动爬取。本文主要探讨python网络爬虫技术的主要内容,及其对网页数据爬取、永久保存的实现流程。
引用
收藏
页码:143 / 145
页数:3
相关论文