改进的K-means聚类k值选择算法

被引:111
作者
王建仁
马鑫
段刚龙
机构
[1] 西安理工大学经济与管理学院
关键词
K-均值算法; k值选择; ET-SSE算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
空间聚类算法中,聚类的效果在很大程度上受制于最佳k值的选择。典型的K-均值算法中,聚类数k需要事先确定,但在实际情况中k的取值很难确定。针对手肘法在确定k值的过程中存在的"肘点"位置不明确问题,基于指数函数性质、权重调节、偏执项和手肘法基本思想,提出了一种改进的k值选择算法ET-SSE算法。通过多个UCI数据集和K-means聚类算法对该算法进行实验,结果表明,使用该k值选择算法相比于手肘法能更加快速且准确地确定k值。
引用
收藏
页码:27 / 33
页数:7
相关论文
共 18 条
[1]   基于搜索改进的KNN文本分类算法 [J].
殷亚博 ;
杨文忠 ;
杨慧婷 ;
许超英 .
计算机工程与设计, 2018, 39 (09) :2923-2928
[2]   基于云计算平台Hadoop的HKM聚类算法设计研究 [J].
张淑芬 ;
董岩岩 ;
陈学斌 .
应用科学学报, 2018, 36 (03) :524-534
[3]   基于Python的长文本比较研究——以《管子》与《国富论》经济思想比较为例 [J].
姜安印 ;
冯龙飞 .
图书与情报, 2018, (02) :67-73
[4]   基于LDA主题模型的文献关联分析及可视化研究 [J].
王丽 ;
邹丽雪 ;
刘细文 .
数据分析与知识发现 , 2018, (03) :98-106
[5]   基于密度峰值优化的Canopy-Kmeans并行算法附视频 [J].
李琪 ;
张欣 ;
张平康 ;
张航 .
通信技术, 2018, (02) :312-317
[6]   最小化误差平方和k-means初始聚类中心优化方法 [J].
周本金 ;
陶以政 ;
纪斌 ;
谢永辉 .
计算机工程与应用 , 2018, (15) :48-52
[7]   优化初始聚类中心及确定K值的K-means算法 [J].
蒋丽 ;
薛善良 .
计算机与数字工程, 2018, 46 (01) :21-24+113
[8]   A study on the changes of dynamic feature code when fixing bugs: towards the benefits and costs of Python dynamic features [J].
Zhifei CHEN ;
Wanwangying MA ;
Wei LIN ;
Lin CHEN ;
Yanhui LI ;
Baowen XU .
ScienceChina(InformationSciences), 2018, 61 (01) :169-186
[9]   基于森林优化特征选择算法的改进研究 [J].
初蓓 ;
李占山 ;
张梦林 ;
于海鸿 .
软件学报, 2018, 29 (09) :2547-2558
[10]   基本初等函数的高精度快速计算的加速算法 [J].
蒋亚萍 ;
贺超 ;
秦惠增 .
数学的实践与认识, 2017, 47 (13) :238-246