拐点估计的改进谱聚类算法

被引:4
作者
张嘉琪 [1 ,2 ]
张红云 [1 ,2 ]
机构
[1] 同济大学计算机科学与技术系
[2] 同济大学嵌入式系统与服务计算教育部重点实验室
基金
上海市自然科学基金;
关键词
谱聚类; 聚类个数; CFSFDP; 拐点估计;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对现有谱聚类算法不稳定,处理复杂分布数据较困难,需要手动输入聚类个数的问题,利用基于快速搜索和密度峰的聚类算法CFSFDP(Clustering by Fast Search and Find of Density Peaks),提出一种改进的谱聚类算法.本算法首先借鉴基于流形距离核的谱聚类算法计算数据的低维嵌入,将分布复杂或者类内不存在密度极值点的数据转换成类球状的低维嵌入代表点.接着,提出用CFSFDP算法代替基于流形距离核的谱聚类算法中Kmeans算法对低维嵌入进行处理.最后,基于CFSFDP算法的局部密度和距离属性的概念,提出拐点估计方法来自动确定聚类个数,获取聚类结果.实验表明,针对复杂分布的测试数据集,本算法能准确地确定聚类个数,获得很好的聚类效果,同时本算法需要输入的参数较少,且在一定范围内表现出较强的鲁棒性.
引用
收藏
页码:1049 / 1053
页数:5
相关论文
共 10 条
[1]   基于局部和全局信息的改进聚类算法 [J].
许小龙 ;
王士同 ;
梅向东 .
计算机工程, 2015, 41 (06) :165-171
[2]   基于局部密度估计和近邻关系传播的谱聚类 [J].
葛洪伟 ;
李志伟 ;
杨金龙 .
模式识别与人工智能, 2014, 27 (09) :856-864
[3]   基于密度与路径的稳健谱聚类 [J].
许洪玮 ;
曹江中 ;
何家峰 ;
戴青云 .
计算机工程与应用 , 2015, (02) :165-170
[4]   近邻传播的文本聚类集成谱算法 [J].
卢志茂 ;
李纯 ;
张琦 .
哈尔滨工程大学学报, 2012, 33 (07) :899-905
[5]   一种基于流形距离核的谱聚类算法 [J].
陶新民 ;
宋少宇 ;
曹盼东 ;
付丹丹 .
信息与控制, 2012, 41 (03) :307-313
[6]   密度敏感的半监督谱聚类 [J].
王玲 ;
薄列峰 ;
焦李成 .
软件学报, 2007, (10) :2412-2422
[7]  
基于密度的层次聚类算法研究.[D].张文开.中国科学技术大学.2015, 09
[8]  
Local information-based fast approximate spectral clustering.[J].Jiangzhong Cao;Pei Chen;Qingyun Dai;Wing-Kuen Ling.Pattern Recognition Letters.2014,
[9]  
Local density adaptive similarity measurement for spectral clustering.[J].Xianchao Zhang;Jingwei Li;Hong Yu.Pattern Recognition Letters.2010, 2
[10]   A tutorial on spectral clustering [J].
von Luxburg, Ulrike .
STATISTICS AND COMPUTING, 2007, 17 (04) :395-416