基于Heritrix的主题网络爬虫设计与实现

被引:3
作者
高伟锋
机构
[1] 广西大学计算机与电子信息学院
关键词
Heritrix; 主题网络爬虫; 遗传算法; 搜索引擎;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
通过介绍主题网络爬虫,以及使用Java开发的开源网络爬虫Heritrix的系统构架,设计基于遗传算法的主题网络爬虫算法,并使用Heritrix构造基于遗传算法的主题网络爬虫。实验结果表明,采用Heritrix实现的基于遗传算法的主题网络爬虫,能取得不错的效果。
引用
收藏
页码:97 / 100
页数:4
相关论文
共 2 条