用户兴趣空间的Web页面聚类

被引:8
作者
郭岩
机构
[1] 中国科学院计算技术研究所北京
关键词
日志挖掘; 聚类; 用户兴趣空间; 对偶性;
D O I
10.19304/j.cnki.issn1000-7180.2003.08.003
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。
引用
收藏
页码:10 / 14+68 +68
页数:6
相关论文
共 5 条
[1]   文本聚类中权重计算的对偶性策略 [J].
卜东波 ;
白硕 ;
李国杰 .
软件学报, 2002, (11) :2083-2089
[2]   基于Web-Log Mining的Web文档聚类 [J].
苏中 ;
马少平 ;
杨强 ;
张宏江 .
软件学报, 2002, (01) :99-104
[3]   基于归纳化会话的网络用户的聚类 [J].
黄松 ;
刘晓明 ;
宋自林 .
计算机研究与发展, 2001, (10) :1224-1228
[4]   Web日志的高效多能挖掘算法 [J].
宋擒豹 ;
沈钧毅 .
计算机研究与发展, 2001, (03) :328-333
[5]  
线性代数及其应用.[M].[美]C·Strang 著;侯自新等 译.南开大学出版社.1990,