基于Web使用挖掘技术的聚类算法改进

被引:5
作者
李诗诗
方寿海
机构
[1] 南京工业大学信息科学与工程学院
关键词
Web使用挖掘; 聚类; Hamming距离; bipartite图; 关联矩阵;
D O I
10.16208/j.issn1000-7024.2009.22.018
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Web使用挖掘中的聚类算法可以聚集相似特性的用户和页面,以便从中提取有用的感兴趣的信息。通过深入分析基于Hamming距离的聚类算法,指出其中存在的不合理性和低效性,然后根据这些不足引入了加权的bipartite图来表示整个数据集,修改了Hamming距离计算公式以便更准确地描述两对象间的相似度,并对算法进行了改进。实验结果表明,改进的算法是准确且高效的。
引用
收藏
页码:5182 / 5184
页数:3
相关论文
empty
未找到相关数据