共 2 条
基于Heritrix的主题网络爬虫设计与实现
被引:3
作者:
高伟锋
机构:
[1] 广西大学计算机与电子信息学院
来源:
关键词:
Heritrix;
主题网络爬虫;
遗传算法;
搜索引擎;
D O I:
暂无
中图分类号:
TP391.3 [检索机];
学科分类号:
摘要:
通过介绍主题网络爬虫,以及使用Java开发的开源网络爬虫Heritrix的系统构架,设计基于遗传算法的主题网络爬虫算法,并使用Heritrix构造基于遗传算法的主题网络爬虫。实验结果表明,采用Heritrix实现的基于遗传算法的主题网络爬虫,能取得不错的效果。
引用
收藏
页码:97 / 100
页数:4
相关论文