基于密度期望和有效性指标的K-均值算法

被引:9
作者
何云斌
肖宇鹏
万静
李松
机构
[1] 哈尔滨理工大学计算机科学与技术学院
基金
黑龙江省自然科学基金;
关键词
K-均值聚类; 初始聚类中心点; 期望密度; k值优化;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
传统K-均值聚类算法虽然收敛速度快,但存在聚类数k无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度期望区间内相距最远的k个样本作为初始聚类中心。该方案可有效降低K-均值算法对初始中心点的依赖,从而获得较高的聚类质量。在此基础上,可进一步通过选择合适的聚类有效性指标Silhouette指标分析不同k值下的每次聚类结果,确定最佳聚类数,则可有效改善k值无法预先确定的缺点。实验及分析结果验证了所提出方案的可行性和有效性。
引用
收藏
页码:105 / 111
页数:7
相关论文
共 15 条
[1]   一种结合人工蜂群和K-均值的混合聚类算法 [J].
毕晓君 ;
宫汝江 .
计算机应用研究, 2012, 29 (06) :2040-2042+2046
[2]   一种有效的K-means聚类中心初始化方法 [J].
熊忠阳 ;
陈若田 ;
张玉芳 .
计算机应用研究, 2011, 28 (11) :4188-4190
[3]   可变阈值的K-Means初始中心选择方法 [J].
刘一鸣 ;
张化祥 .
计算机工程与应用 , 2011, (32) :56-58
[4]   新的K-均值算法最佳聚类数确定方法 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机工程与应用, 2010, 46 (16) :27-31
[5]   改进遗传算法的K-均值聚类算法研究 [J].
徐家宁 ;
张立文 ;
徐素莉 ;
李进 .
微计算机应用, 2010, 31 (04) :11-15
[6]   简单有效的确定聚类数目算法 [J].
张忠平 ;
王爱杰 ;
柴旭光 .
计算机工程与应用, 2009, 45 (15) :166-168
[7]   一种优化初始中心点的K-means算法 [J].
汪中 ;
刘贵全 ;
陈恩红 .
模式识别与人工智能, 2009, 22 (02) :299-304
[8]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[9]   一种改进的基于特征赋权的K均值聚类算法 [J].
任江涛 ;
施潇潇 ;
孙婧昊 ;
黄焕宇 ;
印鉴 .
计算机科学, 2006, (07) :186-187
[10]   K-MEANS算法中的K值优化问题研究 [J].
杨善林 ;
李永森 ;
胡笑旋 ;
潘若愚 .
系统工程理论与实践, 2006, (02) :97-101