深度Web资源探测系统的研究与实现

被引:7
作者
李涛
陈鹏
李哲
机构
[1] 北京航空航天大学计算机学院
关键词
Crawler; Deep Search; DeepWeb; 基于站点爬行;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
本文介绍了深度Web的资源重要性和传统爬虫工作的原理。为了能够更好的利用传统爬虫获取深度Web资源和解决传统爬虫在工作中的不足,提出了一种任务可定制化的爬虫框架,并基于可定制化的任务,实现探测网络深度资源的功能。
引用
收藏
页码:185 / 187
页数:3
相关论文
共 5 条
  • [1] Effi-cient URL Caching for World Wide Web Crawling. Andrei Z.Broder,Marc Najork,Janet L.Wiener. .
  • [2] Modern Infor-mation Retrieval. Ricardo Baeza-Yates,Berthier Ribeiro-Neto etc. .
  • [3] Indexing the invisible web:a survey. Yanbo Ru,Ellis Horowitz. .
  • [4] Searching for Hidden-Web DataBases. Luciano Barbosa,Juliana Freire. .
  • [5] The Hidden Web. Henry Kautz,Bart Selman,Mehul Shah. .