深度Web资源探测系统的研究与实现

被引：7

作者：

李涛

陈鹏

李哲

机构：

[1] 北京航空航天大学计算机学院

来源：

微计算机信息 | 2007年 / 33期

关键词：

Crawler; Deep Search; DeepWeb; 基于站点爬行;

D O I：

暂无

中图分类号：

TP393.092 [];

学科分类号：

摘要：

本文介绍了深度Web的资源重要性和传统爬虫工作的原理。为了能够更好的利用传统爬虫获取深度Web资源和解决传统爬虫在工作中的不足,提出了一种任务可定制化的爬虫框架,并基于可定制化的任务,实现探测网络深度资源的功能。

引用

收藏

页码：185 / 187

页数：3

相关论文

共 5 条

[1] Effi-cient URL Caching for World Wide Web Crawling. Andrei Z.Broder,Marc Najork,Janet L.Wiener. .
[2] Modern Infor-mation Retrieval. Ricardo Baeza-Yates,Berthier Ribeiro-Neto etc. .
[3] Indexing the invisible web:a survey. Yanbo Ru,Ellis Horowitz. .
[4] Searching for Hidden-Web DataBases. Luciano Barbosa,Juliana Freire. .
[5] The Hidden Web. Henry Kautz,Bart Selman,Mehul Shah. .