渐进/分布式网页聚类算法PG+与PG++

被引:9
作者
王启新
李毅
董丽
聂宇
王克宏
机构
[1] 清华大学计算机科学与技术系,清华大学计算机科学与技术系,清华大学计算机科学与技术系,清华大学计算机科学与技术系,清华大学计算机科学与技术系北京,北京,北京,北京,北京
关键词
Web; 渐进; 分布式; PageGather; 聚类;
D O I
10.13328/j.cnki.jos.2002.08.022
中图分类号
TP393.092 [];
学科分类号
摘要
用户行为分析是Web站点信息推荐中的重要方法,被广泛应用在该领域的诸多算法中.PageGather算法是其中有代表性的一种.旨在解决静态PageGather算法输入数据量过大、时间复杂度高的问题,使其更具实用性.通过引入渐进学习和分布的机制,给出了改进的算法PG+和PG++,并进行了实验分析.改进后,既保证了算法的等效性,又明显提高了效率.
引用
收藏
页码:1500 / 1507
页数:8
相关论文
共 2 条
[1]
WEB用户的视图 [J].
阳小华 ;
周龙骧 .
软件学报, 1999, (07) :690-693
[2]
数据结构.[M].严蔚敏;吴伟民编著;.清华大学出版社.1992,