正则表达式在python爬虫中的应用

被引:7
作者
苻玲美
机构
[1] 海南体育职业技术学院
关键词
爬虫; python; 正则表达式; 数据;
D O I
10.14004/j.cnki.ckt.20190929.001
中图分类号
TP391.3 [检索机]; TP312.1 [];
学科分类号
081203 ; 0835 ; 081202 ;
摘要
数据是新一轮技术革命最重要的生产资料,爬虫是获取数据最直接的方式,但爬出来的数据代码夹杂文字,面对大量杂乱的代码夹杂信息,通过正则表达式检索匹配出有用的信息,过滤无用的数据。本文介绍正则表达式在python爬虫中的应用,总结python爬虫中正则表达式的应用技巧。
引用
收藏
页码:253 / 254
页数:2
相关论文
共 4 条
[1]   基于文本挖掘的95598投诉工单关键信息提取分析 [J].
万磊 ;
严道波 ;
杨勇 ;
何镇庭 ;
邱丹 ;
吴迪 .
电力与能源, 2019, 40 (01) :70-72
[2]   基于Python的Web信息获取方法研究 [J].
魏冬梅 ;
何忠秀 ;
唐建梅 .
软件导刊, 2018, 17 (01) :41-43
[3]   基于Python爬虫技术的网页数据抓取与分析研究 [J].
熊畅 .
数字技术与应用, 2017, (09) :35-36
[4]  
精通正则表达式.[M].(美) 佛瑞德 (Friedl;J.E.F.) ; 著.电子工业出版社.2007,