一种基于文本内容的HITS改进算法

被引:3
作者
郭鸿
机构
[1] 桂林电子科技大学计算机与控制学院
关键词
HITS算法; 主题漂移; 文本内容; 权威网页; 中心网页;
D O I
暂无
中图分类号
TP393.01 [];
学科分类号
081201 ; 1201 ;
摘要
HITS算法是WEB结构挖掘中一种经典的链接分析算法,其主要问题是容易发生主题漂移。针对这一问题,提出了一种基于文本内容和链接分析相结合的改进算法。实验证明改进后的算法提高了查询结果的相关度,减少了主题漂移的发生。
引用
收藏
页码:38 / 40+131 +131
页数:4
相关论文
共 3 条
[1]   结构挖掘中web有向图模型的改进算法 [J].
倪现君 .
微计算机信息, 2007, (36) :163-165
[2]   万维网的链接结构分析及其应用综述 [J].
王晓宇 ;
周傲英 .
软件学报, 2003, (10) :1768-1780
[3]  
Automatic resource compilation by analyzing hyperlink structure and associated text[J] . Soumen Chakrabarti,Byron Dom,Prabhakar Raghavan,Sridhar Rajagopalan,David Gibson,Jon Kleinberg.Computer Networks and ISDN Systems . 1998 (1)