一种基于特征间隙的检测簇数的谱聚类算法

被引:1
作者
胡海峰 [1 ,2 ]
刘萍萍 [1 ]
机构
[1] 南京邮电大学通信与信息工程学院宽带无线通信与传感网技术教育部重点实验室
[2] 东南大学移动通信国家重点实验室
基金
中国博士后科学基金;
关键词
谱聚类; 簇数; 特征间隙; 高斯相似度;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据挖掘中如何根据数据之间的相似度确定簇(Cluster)数一直是聚类算法中需要解决的难题。文中在经典谱聚(Spectral Clustering)算法的基础上提出了一种基于特征间隙检测簇数的谱聚类算法(Spectral Clustering with Identifying Clustering Number based on Eigengap,SC-ICNE)。通过构建规范的拉普拉斯矩阵,顺序求解其特征值和相应特征向量,并得到矩阵相邻特征值的间隙,通过判断特征间隙的位置来确定簇数k。最后,通过对前k个特征向量的k-means算法实现数据集的聚类。文中通过仿真分析了高斯相似度函数对SC-ICNE聚类性能的影响,在非凸球形数据集和UCI数据集上进行了性能仿真,并和k-means聚类算法进行了对比,在检测簇数和聚类准确性方面,验证了SC-ICNE算法的有效性。
引用
收藏
页码:37 / 42
页数:6
相关论文
共 8 条
[1]   K-Means聚类算法的研究 [J].
周爱武 ;
于亚飞 .
计算机技术与发展, 2011, 21 (02) :62-65
[2]   谱聚类算法综述 [J].
蔡晓妍 ;
戴冠中 ;
杨黎斌 .
计算机科学, 2008, (07) :14-18
[3]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[4]   谱聚类的扰动分析 [J].
田铮 ;
李小斌 ;
句彦伟 .
中国科学(E辑:信息科学), 2007, (04) :527-543
[5]   数据挖掘中的聚类算法综述 [J].
贺玲 ;
吴玲达 ;
蔡益朝 .
计算机应用研究, 2007, (01) :10-13
[6]   A tutorial on spectral clustering [J].
von Luxburg, Ulrike .
STATISTICS AND COMPUTING, 2007, 17 (04) :395-416
[7]  
Investigating diversity of clustering methods: An empirical comparison[J] . Roy Gelbard,Orit Goldman,Israel Spiegler. Data & Knowledge Engineering . 2007 (1)
[8]  
Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn. ACM Computing Surveys (CSUR) . 1999 (3)