Web结构挖掘算法探讨

被引:17
作者
宋建康
张礼平
机构
[1] 华东理工大学信息科学与工程学院
[2] 华东理工大学信息科学与工程学院 上海
[3] 上海
关键词
Web结构挖掘; HITS; XML; Hub; 权威页面;
D O I
10.14135/j.cnki.1006-3080.2003.05.026
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
在分析Web结构挖掘现有算法的基础上,重点研究了HITS(Hyperlink-InducedTopicSearch)算法。Hub页面的多主题性、无关页面和无关链接等对于HITS算法有较大影响。针对这些问题,提出了HITS算法的改进算法。
引用
收藏
页码:537 / 540
页数:4
相关论文
共 1 条
[1]  
Authoritative sources in a hyperlinked environment. Kleinberg J. Journal of ACM(JASM) . 1999