K-Means算法的研究与改进

被引:18
作者
周爱武
陈宝楼
王琰
机构
[1] 安徽大学计算机科学与技术学院
关键词
K-Means算法; 孤立点; 初始聚类中心;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。虽然该算法有很多优点,但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对孤立点比较敏感等。文中首先应用统计学中的标准分数对样本进行孤立点分析,然后提出一种新的初始聚类中心确定策略。对改进的算法和原算法分别做实验进行比较,实验结果表明,改进的算法在准确率、收敛速度和稳定性方面都有很大的提高。
引用
收藏
页码:101 / 104
页数:4
相关论文
共 7 条
[1]  
Top 10 algorithms in data mining.[J].Xindong Wu;Vipin Kumar;J. Ross Quinlan;Joydeep Ghosh;Qiang Yang;Hiroshi Motoda;Geoffrey J. McLachlan;Angus Ng;Bing Liu;Philip S. Yu;Zhi-Hua Zhou;Michael Steinbach;David J. Hand;Dan Steinberg.Knowledge and Information Systems.2009, 1
[2]  
统计学.[M].贾俊平; 编著.中国人民大学出版社.2006,
[3]   一种进行K-Means聚类的有效方法 [J].
黄震华 ;
向阳 ;
张波 ;
王栋 ;
刘啸岭 .
模式识别与人工智能, 2010, 23 (04) :516-521
[4]   基于K均值聚类和概率松弛法的图像区域分割 [J].
周卫星 ;
廖欢 .
计算机技术与发展, 2010, 20 (02) :68-70+74
[5]   一种优化初始中心点的K-Means文本聚类算法 [J].
朱颢东 ;
钟勇 ;
赵向辉 .
郑州大学学报(理学版), 2009, 41 (02) :29-32
[6]   一种优化初始中心点的K-means算法 [J].
汪中 ;
刘贵全 ;
陈恩红 .
模式识别与人工智能, 2009, 22 (02) :299-304
[7]   初始聚类中心优化的k-means算法 [J].
袁方 ;
周志勇 ;
宋鑫 .
计算机工程, 2007, (03) :65-66