基于主题的Web信息采集系统的设计与实现

被引:23
作者
李盛韬
赵章界
余智华
机构
[1] 中国科学院计算技术研究所软件研究室
[2] 中国科学院计算技术研究所软件研究室 北京
[3] 北京
[4] 北京
关键词
信息采集; 信息检索; 信息处理; 主题采集;
D O I
暂无
中图分类号
TP274.2 [];
学科分类号
摘要
基于主题的Web信息采集是信息检索领域内一个新兴且有实用价值的方向,也是信息处理技术中的一个研究热点。文章分析了主题Web信息采集的基本问题,提出了难点以及相关的解决方案,并在此基础上设计实现了“天达”主题Web信息采集系统。
引用
收藏
页码:102 / 104
页数:3
相关论文
共 4 条
[1]  
Evaluating Topic-driven Web Crawlers. Menczer F, Srinivasan G P P, Ruiz M. . 2001
[2]  
Intelligent Crawling on the World Wide Web with Arbitrary Predicates. Aggarwal C, Al-Garawi F, Yu P. . 2001
[3]  
Gori Focused Crawling Using Context Graphs. Diligenti M, Coetzee F M, Lawrence S, et al. . 2000
[4]  
Menczer F,Srinivasan G P P,Ruiz M.Evaluating Topic-driven Web Crawlers. . 2001