基于分位数半径的动态K-means算法

被引:8
作者
程明畅 [1 ]
刘友波 [2 ]
张程嘉 [2 ]
马铁丰 [1 ]
机构
[1] 西南财经大学统计学院
[2] 四川大学电气信息学院
关键词
K-means; 类的数目; 分位数半径; 动态K-means;
D O I
10.13232/j.cnki.jnju.2018.01.006
中图分类号
TP311.13 [];
学科分类号
摘要
K-means算法是应用最广泛的聚类算法之一,但存在明显缺陷:对初始值敏感,还需给定类的数目.层次K-means算法提出将多次k取固定值的K-means运算所得到的中心点作为类的代表,并通过对这些中心点进行层次聚类来得到更好的初始聚类中心,然而在中心的融合过程中并没有有效利用类的几何信息.从类的几何特征入手,提出一种基于类的分位数半径的动态K-means算法(QRD K-means).此算法在层次K-means的基础上令每次K-means运算的k值变动起来,且又引入了分位数半径的概念,用样本点到类中心距离的分位数作为类的半径,将样本点间的关系简化为各个类的分位数半径与类中心的关系.通过中心点间距离与分位数半径大小的比较对中心点进行融合形成新类,从而快速给出良好的聚类结果,同时也确定了类的数目.在仿真实验中,通过与不同算法在时间和分类精确度上的比较分析,也证明该方法快速有效.
引用
收藏
页码:48 / 55
页数:8
相关论文
共 6 条
[1]
聚类方法综述 [J].
金建国 .
计算机科学, 2014, 41(S2) (S2) :288-293
[2]
基于划分的K-均值初始聚类中心优化算法 [J].
苏锦旗 ;
薛惠锋 ;
詹海亮 .
微电子学与计算机, 2009, 26 (01) :8-11
[3]
A sample-based hierarchical adaptive K -means clustering method for large-scale video retrieval.[J].Kaiyang Liao;Guizhong Liu;Li Xiao;Chaoteng Liu.Knowledge-Based Systems.2013,
[4]
A hierarchical k -means clustering based fingerprint quality classification.[J].Muhammad Umer Munir;Muhammad Younus Javed;Shoab Ahmad Khan.Neurocomputing.2012,
[5]
The global k -means clustering algorithm.[J].Aristidis Likas;Nikos Vlassis;Jakob J. Verbeek.Pattern Recognition.2002, 2
[6]
Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304