学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种Web用户行为聚类算法
被引:20
作者
:
业宁
论文数:
0
引用数:
0
h-index:
0
机构:
东南大学计算机科学与工程系
业宁
李威
论文数:
0
引用数:
0
h-index:
0
机构:
东南大学计算机科学与工程系
李威
梁作鹏
论文数:
0
引用数:
0
h-index:
0
机构:
东南大学计算机科学与工程系
梁作鹏
董逸生
论文数:
0
引用数:
0
h-index:
0
机构:
东南大学计算机科学与工程系
董逸生
机构
:
[1]
东南大学计算机科学与工程系
[2]
南京林业大学信息学院
[3]
东南大学计算机科学与工程系 江苏南京
[4]
江苏南京
来源
:
小型微型计算机系统
|
2004年
/ 07期
关键词
:
Web日志;
数据挖掘;
聚类;
相似度;
D O I
:
暂无
中图分类号
:
TP393 [计算机网络];
学科分类号
:
081201 ;
1201 ;
摘要
:
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 .
引用
收藏
页码:1364 / 1367
页数:4
相关论文
共 2 条
[1]
路径聚类:在Web站点中的知识发现
[J].
王实
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
王实
;
论文数:
引用数:
h-index:
机构:
高文
;
李锦涛
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
李锦涛
;
谢辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
谢辉
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
不详
.
计算机研究与发展 ,
2001,
(04)
:482
-486
[2]
实用多元统计分析.[M].方开泰编著;.华东师范大学出版社.1989,
←
1
→
共 2 条
[1]
路径聚类:在Web站点中的知识发现
[J].
王实
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
王实
;
论文数:
引用数:
h-index:
机构:
高文
;
李锦涛
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
李锦涛
;
谢辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
谢辉
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
不详
.
计算机研究与发展 ,
2001,
(04)
:482
-486
[2]
实用多元统计分析.[M].方开泰编著;.华东师范大学出版社.1989,
←
1
→