网页标题分析对主题爬虫的改进

被引:11
作者
袁浩
黄烟波
机构
[1] 中南大学信息科学与工程学院
关键词
网页标题分析; Web结构挖掘; 主题爬虫; 主题相关度; 语义分析;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确的主题爬虫显得十分迫切。然而目前的主题爬虫所采用的两种基本抓取网页的方式效率比较低下。提出了一种通过网页标题分析对主题爬虫的改进方案,比较了引入标题分析前后的结果,论证了设计的可行性与可操作性,优化了主题爬虫对同类型特定信息的抓取。
引用
收藏
页码:22 / 24+28 +28
页数:4
相关论文
empty
未找到相关数据