基于网页内容和链接价值的相关度方法的实现

被引:4
作者
郑国良
叶飞跃
张滨
林国俊
机构
[1] 上海大学计算机工程与科学学院
关键词
主题爬虫; 专业搜索; 网页内容分析; 链接分析; 特征词;
D O I
10.16208/j.issn1000-7024.2008.23.056
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
专业搜索引擎提供特定主题的信息检索服务,是新一代搜索引擎的发展方向之一,而网页主题相关度分析是专搜索引擎的核心技术,它指导着robot进行有价值的搜索,专门搜索与主题相关的页面;提出一种综合的网页主题相关度析方法,方法同时对网页内容价值和链接价值进行了考察,从而保证了robot搜索的网页与主题有着较高的相关度;在网内容价值评价时,对传统的方法进行了改进,新的方法能高好的实现。该方法也用于服装行业的搜索引擎,效果明显。
引用
收藏
页码:6020 / 6022+6046 +6046
页数:4
相关论文
empty
未找到相关数据