一种Web用户行为聚类算法

被引:20
作者
业宁
李威
梁作鹏
董逸生
机构
[1] 东南大学计算机科学与工程系
[2] 南京林业大学信息学院
[3] 东南大学计算机科学与工程系 江苏南京
[4] 江苏南京
关键词
Web日志; 数据挖掘; 聚类; 相似度;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 .
引用
收藏
页码:1364 / 1367
页数:4
相关论文
共 2 条
[1]   路径聚类:在Web站点中的知识发现 [J].
王实 ;
高文 ;
李锦涛 ;
谢辉 ;
不详 .
计算机研究与发展 , 2001, (04) :482-486
[2]  
实用多元统计分析.[M].方开泰编著;.华东师范大学出版社.1989,