从多角度分析现有聚类算法(英文)

被引：53

作者：

钱卫宁

周傲英

机构：

[1] 复旦大学计算机科学系

[2] 复旦大学智能信息处理开放实验室

来源：

软件学报 | 2002年 / 08期

关键词：

数据挖掘; 聚类分析; 算法;

D O I：

10.13328/j.cnki.jos.2002.08.006

中图分类号：

TP311.12 [];

学科分类号：

摘要：

聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础.

引用

页码：1382 / 1394

页数：13