在高维数据上的近邻传播聚类降维研究

被引:6
作者
李界家 [1 ]
郭鹏程 [1 ]
韩忠华 [1 ,2 ]
机构
[1] 沈阳建筑大学信息与控制工程学院
[2] 中科院网络化控制系统重点实验室
关键词
数据聚类; 高维空间; 降维; 近邻传播聚类; 谱分析;
D O I
10.14107/j.cnki.kzgc.150152
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了使近邻传播(AP)聚类在高维空间中获得更好的聚类效果,该文提出一种基于谱分析的近邻传播聚类方法(Affinity Propagation based on Spectrum analyze,AP-SA)。首先,通过采用谱分析技术将分布在高维非线性的数据点集映射到几乎线性的子空间上,映射过程实现高维数据降至低维。最后,通过AP聚类算法对映射在低维空间上的数据进行聚类,从而提高了AP算法在高维空间上的聚类性能。仿真实验结果表明,该方法相比于传统AP算法,在低维数据中无明显的优势,但随着实验的数据集的样本规模与维数的增加,在高维数据中的该方法降低了聚类时间的同时,也保证了较好的聚类效果。
引用
收藏
页码:1418 / 1422
页数:5
相关论文
共 7 条
[1]   基于近邻传播算法的最佳聚类数确定方法比较研究 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机科学, 2011, 38 (02) :225-228
[2]   高维数据聚类方法综述 [J].
贺玲 ;
蔡益朝 ;
杨征 .
计算机应用研究, 2010, 27 (01) :23-26+31
[3]   谱聚类算法综述 [J].
蔡晓妍 ;
戴冠中 ;
杨黎斌 .
计算机科学, 2008, (07) :14-18
[4]   自适应仿射传播聚类 [J].
王开军 ;
张军英 ;
李丹 ;
张新娜 ;
郭涛 .
自动化学报, 2007, (12) :1242-1246
[5]   一种基于超图模式的高维空间数据聚类方法 [J].
张蓉 ;
彭宏 .
计算机工程, 2002, (07) :54-55+164
[6]  
The Handbook of Brain Theory and Neural Networks..M. A. Arbib;.The MIT Press.2002,
[7]   ON INFORMATION AND SUFFICIENCY [J].
KULLBACK, S ;
LEIBLER, RA .
ANNALS OF MATHEMATICAL STATISTICS, 1951, 22 (01) :79-86