基于网页浏览行为的反爬虫研究

被引:4
作者
刘洋
机构
[1] 四川大学计算机学院
关键词
网络爬虫; 反爬虫方法; 用户浏览行为; 网站;
D O I
暂无
中图分类号
TP393.092 []; TP391.3 [检索机];
学科分类号
摘要
在大数据的背景下,数据的潜在价值被不断地挖掘出来。能够有效识别或阻挡爬取行为的反爬虫方法对于商业服务网站来说尤为重要。基于网页浏览行为,提出一种新的反爬虫方法。该方法通过对真实用户和网络爬虫浏览网页的行为进行特征提取,然后构造并使用决策树对一个用户是否属于爬虫进行预测。该方法对网络爬虫的敏感性高,并具有较低的假阴率。
引用
收藏
页码:58 / 60+70 +70
页数:4
相关论文
共 6 条