共 12 条
深层网络爬虫研究综述
被引:36
作者:

曾伟辉
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院合肥智能机械研究所 中国科学院合肥智能机械研究所

李淼
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院合肥智能机械研究所 中国科学院合肥智能机械研究所

曾伟辉
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学技术大学自动化系 中国科学院合肥智能机械研究所
机构:
[1] 中国科学院合肥智能机械研究所
[2] 中国科学技术大学自动化系
来源:
关键词:
深层网络;
网络爬虫;
信息检索;
URL;
动态网页;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
引用
收藏
页码:122 / 126
页数:5
相关论文
共 12 条
- [1] 深度Web资源探测系统的研究与实现[J]. 微计算机信息, 2007, (33) : 185 - 187论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:李哲论文数: 0 引用数: 0 h-index: 0机构: 北京航空航天大学计算机学院
- [2] 主题网络爬虫研究综述[J]. 计算机应用研究, 2007, (10) : 26 - 29+47刘金红论文数: 0 引用数: 0 h-index: 0机构: 解放军电子工程学院网络系陆余良论文数: 0 引用数: 0 h-index: 0机构: 解放军电子工程学院网络系
- [3] 基于XQuery的Deep Web搜索系统的设计与实现[J]. 科学技术与工程, 2007, (16) : 4080 - 4084孙彬论文数: 0 引用数: 0 h-index: 0机构: 新疆财经大学计算机系王东论文数: 0 引用数: 0 h-index: 0机构: 新疆财经大学计算机系论文数: 引用数: h-index:机构:
- [4] Hidden Web信息获取[J]. 计算机时代, 2007, (05) : 54 - 56陈珂论文数: 0 引用数: 0 h-index: 0机构: 苏州市职业大学 苏州市职业大学陈小英论文数: 0 引用数: 0 h-index: 0机构: 苏州市职业大学 苏州市职业大学徐科论文数: 0 引用数: 0 h-index: 0机构: 苏州大学信息处理及应用研究所 苏州市职业大学
- [5] Deep Web爬虫爬行策略研究[J]. 计算机工程与设计, 2006, (17) : 3154 - 3158郑冬冬论文数: 0 引用数: 0 h-index: 0机构: 苏州大学智能信息处理及应用研究所崔志明论文数: 0 引用数: 0 h-index: 0机构: 苏州大学智能信息处理及应用研究所
- [6] 搜索引擎的基本原理及发展趋势[J]. 电脑知识与技术, 2006, (02) : 84 - 85彭建荣论文数: 0 引用数: 0 h-index: 0机构: 云南大理学院图书馆罗永会论文数: 0 引用数: 0 h-index: 0机构: 云南大理学院图书馆
- [7] Deep Web爬虫研究与设计[J]. 清华大学学报(自然科学版), 2005, (S1) : 1896 - 1902郑冬冬论文数: 0 引用数: 0 h-index: 0机构: 苏州大学计算机科学与技术系 苏州215006赵朋朋论文数: 0 引用数: 0 h-index: 0机构: 苏州大学计算机科学与技术系 苏州215006崔志明论文数: 0 引用数: 0 h-index: 0机构: 苏州大学计算机科学与技术系 苏州215006
- [8] JavaScript引擎在动态网页采集技术中的应用[J]. 计算机应用, 2004, (02) : 33 - 36王映论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所软件研究室于满泉论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所软件研究室李盛韬论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所软件研究室王斌论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所软件研究室余智华论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所软件研究室
- [10] 基于标记树对象抽取技术的Hidden Web获取研究[J]. 计算机工程与应用 , 2002, (23) : 9 - 12+24宋晖论文数: 0 引用数: 0 h-index: 0机构: 上海交通大学计算机系张岭论文数: 0 引用数: 0 h-index: 0机构: 上海交通大学计算机系叶允明论文数: 0 引用数: 0 h-index: 0机构: 上海交通大学计算机系马范援论文数: 0 引用数: 0 h-index: 0机构: 上海交通大学计算机系不详论文数: 0 引用数: 0 h-index: 0机构: 上海交通大学计算机系