基于本体的主题网络爬虫设计

被引:15
作者
戚欣
机构
[1] 武汉理工大学计算机科学与技术学院
关键词
网络爬虫; 主题爬虫; 本体; 主题相关度; 链接分析;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
网络爬虫是搜索引擎的重要组成部分。分析了主题网络爬虫的工作原理,研究了主题相关度的计算方法,提出了基于本体的主题网络爬虫解决方案,设计实现了评估实验系统。最后对实验的结果进行了比较,论证了其可行性。
引用
收藏
页码:138 / 141
页数:4
相关论文
共 7 条
[1]  
基于本体的省情网垂直搜索引擎研究.[D].杜超华.华中师范大学.2007, 04
[2]  
开发自己的搜索引擎.[M].邱哲; 符滔滔; 编著.人民邮电出版社.2007,
[3]   主题网络爬虫研究综述 [J].
刘金红 ;
陆余良 .
计算机应用研究, 2007, (10) :26-29+47
[4]   基于主题的智能Web信息采集系统的研究与实现 [J].
李卫 ;
刘建毅 ;
何华灿 ;
王枞 .
计算机应用研究, 2006, (02) :163-166
[5]   聚焦爬虫技术研究综述 [J].
周立柱 ;
林玲 .
计算机应用, 2005, (09) :1965-1969
[6]   链接分析对主题爬虫的改进 [J].
汪涛 ;
樊孝忠 .
计算机应用, 2004, (S2) :174-176
[7]   基于主题的Web信息采集系统的设计与实现 [J].
李盛韬 ;
赵章界 ;
余智华 .
计算机工程, 2003, (17) :102-104