主题爬虫的设计与实现

被引:40
作者
汪涛
樊孝忠
机构
[1] 北京理工大学计算机科学工程系
关键词
搜索引擎; 主题爬虫; 主题相关度; 链接分析; 信息采集;
D O I
暂无
中图分类号
TP393.08 [];
学科分类号
0839 ; 1402 ;
摘要
文章以主题相关度为核心研究了设计主题爬虫的相关技术 ,通过实验给出了具体实现。实验结果充分论证了其可行性与实用性 ,为进行主题搜索引擎设计和主题信息采集奠定了良好的基础。
引用
收藏
页码:270 / 272
页数:3
相关论文
共 4 条
  • [1] Google的PageRank技术剖析[J].曹军. 情报杂志.2002(10)
  • [2] 搜索引擎与Web挖掘进展[M].高等教育出版社,李晓明,2003
  • [3] 语言计算与基于内容的文本处理[M].清华大学出版社,孙茂松,2003
  • [4] 网络机器人Java编程指南[M].电子工业出版社,(美)JeffHeaton著,2002