基于本征间隙与正交特征向量的自动谱聚类

被引:37
作者
孔万增 [1 ]
孙志海 [1 ]
杨灿 [2 ]
戴国骏 [1 ]
孙昌思核 [1 ]
机构
[1] 杭州电子科技大学计算机学院
[2] 香港科技大学电子及计算机工程学系
关键词
谱聚类; 亲和度矩阵; 本征间隙; 类个数; 正交特征向量;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对经典谱聚类算法无法自动确定数据类个数的问题,本文提出了一种基于本征间隙与正交特征向量的自动谱聚类算法.该方法利用样本数据构建亲和度矩阵,然后进行谱分解得到相应的特征值和特征向量,对特征值从大至小依次排序,用本征间隙来刻画相邻特征值之间的差,通过第一个极大本征间隙出现的位置来自动确定类个数,最后以特征向量之间的夹角作为相似度和已获得的类个数相结合来实现数据分类.本文算法的正确性在人造数据库上得到了验证,并在UCI数据库上与k-means、FCM、Jordan算法进行了分类准确性比较实验,结果表明本文方法比其他三种方法的分类准确率更高.
引用
收藏
页码:1880 / 1885+1891 +1891
页数:7
相关论文
共 8 条
[1]   基于监督信息特性的主动半监督谱聚类算法 [J].
王娜 ;
李霞 .
电子学报, 2010, 38 (01) :172-176
[2]   谱聚类算法综述 [J].
蔡晓妍 ;
戴冠中 ;
杨黎斌 .
计算机科学, 2008, (07) :14-18
[3]   密度敏感的谱聚类 [J].
王玲 ;
薄列峰 ;
焦李成 .
电子学报, 2007, (08) :1577-1581
[4]   谱聚类的扰动分析 [J].
田铮 ;
李小斌 ;
句彦伟 .
中国科学(E辑:信息科学), 2007, (04) :527-543
[6]  
矩阵扰动分析[M]. 科学出版社 , 孙继广 著, 1987
[7]   A tutorial on spectral clustering [J].
von Luxburg, Ulrike .
STATISTICS AND COMPUTING, 2007, 17 (04) :395-416
[8]  
Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn.ACM Computing Surveys (CSUR) . 1999 (3)