大样本数据聚类的改进方法

被引:4
作者
卞亦文
机构
[1] 上海大学悉尼工商学院
关键词
大样本数据; K-means算法; 有效性指标; 黄金分割法;
D O I
10.13546/j.cnki.tjyjc.2009.01.012
中图分类号
O212.1 [一般数理统计];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
K-means算法是处理大样本数据的聚类分析的常用算法之一。该算法的不足之处是聚类的数目k必须事先给定。文章提出应用黄金分割法来度量有关该聚类的有效性,该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类;并采用实际数据说明了方法的合理性和有效性。
引用
收藏
页码:12 / 13
页数:2
相关论文
共 1 条
[1]   对聚类算法普遍存在问题的解决办法 [J].
姜园 ;
张朝阳 ;
仇佩亮 ;
戚玉鹏 .
电路与系统学报, 2004, (03) :92-99