空间密度相似性度量K-means算法

被引:8
作者
薛卫
杨荣丽
赵南
徐焕良
任守纲
机构
[1] 南京农业大学信息科学技术学院
关键词
K-means; 非簇型; 初始聚类中心; 相似性度量;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
传统K-means算法的缺陷有初始聚类中心选择的不稳定、聚类效果对初始聚类中心过于依赖、非簇型数据集分类效果不佳等问题.为克服以上不足,本文提出空间密度相似性度量K-means算法.该算法采用可伸缩空间密度的相似性距离度量数据点间的相似度,并将密度和距离共同作为选择新初始聚类中心的相关因子,以及根据类内距离进行迭代的一种新的类中心迭代模型.在非簇型人工数据集和UCI标准数据集上的实验证明,与传统及其他改进K-means算法相比,本文提出的算法可得到更加合理的初始聚类中心,能反映任意形状的复杂数据集分布规律,算法更加稳定、准确.
引用
收藏
页码:53 / 57
页数:5
相关论文
共 8 条
[1]   基于改进人工蜂群算法的K均值聚类算法 [J].
喻金平 ;
郑杰 ;
梅宏标 .
计算机应用, 2014, 34 (04) :1065-1069+1088
[2]   最大距离法选取初始簇中心的K-means文本聚类算法的研究 [J].
翟东海 ;
鱼江 ;
高飞 ;
于磊 ;
丁锋 .
计算机应用研究, 2014, 31 (03) :713-715+719
[3]   基于密度的改进K均值算法及实现 [J].
傅德胜 ;
周辰 .
计算机应用, 2011, 31 (02) :432-434
[4]   一种改进的k-means初始聚类中心选取算法 [J].
韩凌波 ;
王强 ;
蒋正锋 ;
郝志强 .
计算机工程与应用, 2010, 46 (17) :150-152
[5]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[6]  
PCA-Guided Search for K-means [J] . Qin Xu,Chris Ding,Jinpei Liu,Bin Luo.&nbsp&nbspPattern Recognition Letters . 2014
[7]  
Evolutionary k -means for distributed data sets [J] . M.C. Naldi,R.J.G.B. Campello.&nbsp&nbspNeurocomputing . 2014
[8]   A method for initialising the K-means clustering algorithm using kd-trees [J].
Redmond, Stephen J. ;
Heneghan, Conor .
PATTERN RECOGNITION LETTERS, 2007, 28 (08) :965-973