链接分析对主题爬虫的改进

被引:11
作者
汪涛
樊孝忠
机构
[1] 北京理工大学计算机科学工程系
[2] 北京理工大学计算机科学工程系 北京
[3] 炮兵学院三系
[4] 安徽合肥
[5] 北京
关键词
链接分析; Web结构挖掘; 主题爬虫; 相关度; 信息采集;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
在分析总结两种主题爬虫设计的基础之上,研究了用链接分析改进主题爬虫的方法。通 过实验,比较引入链接分析前后的结果,论证了其设计可行性与可操作性,为实现定向信息采集奠定 了良好的基础。
引用
收藏
页码:174 / 176
页数:3
相关论文
共 6 条
[1]  
搜索引擎与Web挖掘进展.[M].李晓明;李星主编;.高等教育出版社.2003,
[2]  
语言计算与基于内容的文本处理.[M].孙茂松;陈群秀主编;.清华大学出版社.2003,
[3]  
网络机器人Java编程指南.[M].(美)JeffHeaton著;童兆丰等译;.电子工业出版社.2002,
[4]   主题爬虫的设计与实现 [J].
汪涛 ;
樊孝忠 .
计算机应用, 2004, (S1) :270-272
[5]   基于概念分析的主题爬虫设计 [J].
汪涛 ;
樊孝忠 ;
顾益军 ;
刘林 .
北京理工大学学报, 2004, (10) :890-893
[6]   Google的PageRank技术剖析 [J].
曹军 .
情报杂志 , 2002, (10) :15-18