通过Filter抵御网页爬虫

被引:5
作者
刘庆杰
孙旭光
王小英
机构
[1] 防灾科技学院信息工程系
关键词
爬虫; Filter; User-Agent; Web.xml;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
过滤器反爬虫的基本思想就是建立一个可以区分客户请求的总过滤器,根据用户的请求类型实现不同策略的处理。如果是一个普通的客户请求,过滤器将请求继续传递到客户请求的资源上;如果请求时一个爬虫的检索请求,就需要根据自己实际应用的需要,或者直接拒绝爬虫请求,或者延时加载爬虫的请求。另外在过滤器将所有的请求都记录到一个日志系统中,为以后网站的为系统开发﹑测试及性能调整提供依据。
引用
收藏
页码:70 / 71
页数:2
相关论文
共 1 条
  • [1] J2EE 1.4编程指南[M]. 电子工业出版社 , (美)SueSpielman,(美)MeerajKunnumpurath著, 2005