从多角度分析现有聚类算法(英文)

被引:53
作者
钱卫宁
周傲英
机构
[1] 复旦大学计算机科学系
[2] 复旦大学智能信息处理开放实验室
关键词
数据挖掘; 聚类分析; 算法;
D O I
10.13328/j.cnki.jos.2002.08.006
中图分类号
TP311.12 [];
学科分类号
摘要
聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础.
引用
收藏
页码:1382 / 1394
页数:13
相关论文
共 2 条