主题爬虫相关度算法研究综述

被引:8
作者
王帅
周国民
王健
机构
[1] 中国农业科学院农业信息研究所
关键词
相关度; 算法; 主题爬虫; 概念;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
首先阐述主题爬虫相关度算法目标和相关度的计算内涵;然后根据信息处理的进化观点,以信息特征项的处理为线索,分别从字符层、语言层、语义层3个层次系统分析当前主题爬虫相关度的计算方法,并比较不同层次间各个算法的优缺点;最后总结现有的研究成果,并给出进一步的研究方向。
引用
收藏
页码:27 / 30+39 +39
页数:5
相关论文
共 9 条
  • [1] 基于本体语义的定题爬虫
    郑健珍
    林坤辉
    周昌乐
    康恺
    [J]. 山东大学学报(理学版), 2006, (03) : 90 - 94
  • [2] 基于概念分析的主题爬虫设计
    汪涛
    樊孝忠
    顾益军
    刘林
    [J]. 北京理工大学学报, 2004, (10) : 890 - 893
  • [3] 基于领域本体的主题爬虫研究及实现[D]. 林碧霞.西南交通大学. 2010
  • [4] 基于本体的语义网爬虫的算法研究与应用实现[D]. 董晨.北京工业大学. 2010
  • [5] 基于强化学习的垂直搜索引擎网络爬虫的研究与实现[D]. 刘忠.苏州大学. 2008
  • [6] A general evaluation framework for topical crawlers
    Srinivasan, P
    Menczer, F
    Pant, G
    [J]. INFORMATION RETRIEVAL, 2005, 8 (03): : 417 - 447
  • [7] On the design of a learning crawler for topical resource discovery
    Aggarwal, CC
    Al-Garawi, F
    Yu, PS
    [J]. ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2001, 19 (03) : 286 - 309
  • [8] Focused crawling: a new approach to topic-specific Web resource discovery[J] . Soumen Chakrabarti,Martin van den Berg,Byron Dom.Computer Networks . 1999 (11)
  • [9] The shark-search algorithm. An application: tailored Web site mapping[J] . Michael Hersovici,Michal Jacovi,Yoelle S. Maarek,Dan Pelleg,Menachem Shtalhaim,Sigalit Ur.Computer Networks and ISDN Systems . 1998 (1)