二分K均值聚类算法优化及并行化研究

被引:22
作者
张军伟 [1 ]
王念滨 [1 ]
黄少滨 [1 ]
蔄世明 [2 ]
机构
[1] 哈尔滨工程大学计算机科学与技术学院
[2] 哈尔滨工业大学计算机科学与技术学院
关键词
数据挖掘; 聚类算法; 二分K均值; 并行化; 群集系统;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。
引用
收藏
页码:23 / 25
页数:3
相关论文
empty
未找到相关数据