基于Ward’s方法的k-平均优化算法及其应用

被引:7
作者
邱苏林 [1 ]
王丽珍 [2 ]
机构
[1] 不详
[2] 云南司法警官职业学院信息技术系
[3] 不详
[4] 云南大学信息学院
[5] 不详
关键词
k-平均算法; Ward’s方法; 簇数目; 初始聚类中心; 孤立点检测;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
通过对k-平均算法存在不足的分析,提出了一种基于Ward’s方法的k-平均优化算法。算法首先在用Ward’s方法对样本数据初步聚类的基础上,确定合适的簇数目、初始聚类中心等k-平均算法的初始参数,并进行孤立点检测、删除;基于上述处理再采用传统k-平均算法进行聚类。将优化的k-平均算法应用到罪犯人格类型分析中,实验结果表明,该算法的效率、聚类效果均明显优于传统k-平均算法。
引用
收藏
页码:169 / 172
页数:4
相关论文
共 6 条
  • [1] 初始中心优化的K-Means聚类算法
    李飞
    薛彬
    黄亚楼
    [J]. 计算机科学, 2002, (07) : 94 - 96
  • [2] 数据挖掘导论[M]. 人民邮电出版社 , (美)Pang-NingTan, 2006
  • [3] 数据挖掘原理与算法[M]. 清华大学出版社 , 毛国君等编著, 2005
  • [4] 数据挖掘[M]. 机械工业出版社 , (加)JiaweiHan, 2001
  • [5] Cluster center initialization algorithm for K-means clustering
    Khan, SS
    Ahmad, A
    [J]. PATTERN RECOGNITION LETTERS, 2004, 25 (11) : 1293 - 1302
  • [6] Monte Carlo Tests of the Accuracy of Cluster Analysis Algorithms: A Comparison of Hierarchical and Nonhierarchical Methods[J] . Dieter Scheibler,Wolfgang Schneider.Multivariate Behavioral Research . 1985 (3)