共 15 条
基于密度期望和有效性指标的K-均值算法
被引:9
作者:
何云斌
肖宇鹏
万静
李松
机构:
[1] 哈尔滨理工大学计算机科学与技术学院
来源:
基金:
黑龙江省自然科学基金;
关键词:
K-均值聚类;
初始聚类中心点;
期望密度;
k值优化;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
传统K-均值聚类算法虽然收敛速度快,但存在聚类数k无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度期望区间内相距最远的k个样本作为初始聚类中心。该方案可有效降低K-均值算法对初始中心点的依赖,从而获得较高的聚类质量。在此基础上,可进一步通过选择合适的聚类有效性指标Silhouette指标分析不同k值下的每次聚类结果,确定最佳聚类数,则可有效改善k值无法预先确定的缺点。实验及分析结果验证了所提出方案的可行性和有效性。
引用
收藏
页码:105 / 111
页数:7
相关论文