K-means聚类算法的研究

被引:42
作者
韩晓红
胡彧
机构
[1] 太原理工大学计算机与软件学院
关键词
数据挖掘; K-means算法; 初始聚类中心; 聚类分析;
D O I
10.16355/j.cnki.issn1007-9432tyut.2009.03.028
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。
引用
收藏
页码:236 / 239
页数:4
相关论文
共 4 条
[1]   改进的k-平均聚类算法研究 [J].
孙士保 ;
秦克云 .
计算机工程, 2007, (13) :200-201+209
[2]   基于数据场改进的PAM聚类算法 [J].
余建桥 ;
张帆 .
计算机科学, 2005, (01) :165-167
[3]   一种基于Rough集的层次聚类算法 [J].
刘少辉 ;
胡斐 ;
贾自艳 ;
史忠植 .
计算机研究与发展, 2004, (04) :552-557
[4]   用遗传算法改进聚类分析中的K-平均算法 [J].
唐立新 ;
杨自厚 ;
王梦光 .
数理统计与应用概率, 1997, (04) :58-64