共 1 条
大样本数据聚类的改进方法
被引:4
作者:
卞亦文
机构:
[1] 上海大学悉尼工商学院
来源:
关键词:
大样本数据;
K-means算法;
有效性指标;
黄金分割法;
D O I:
10.13546/j.cnki.tjyjc.2009.01.012
中图分类号:
O212.1 [一般数理统计];
学科分类号:
020208 ;
070103 ;
0714 ;
摘要:
K-means算法是处理大样本数据的聚类分析的常用算法之一。该算法的不足之处是聚类的数目k必须事先给定。文章提出应用黄金分割法来度量有关该聚类的有效性,该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类;并采用实际数据说明了方法的合理性和有效性。
引用
收藏
页码:12 / 13
页数:2
相关论文