学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
二分K均值聚类算法优化及并行化研究
被引:22
作者
:
论文数:
引用数:
h-index:
机构:
张军伟
[
1
]
论文数:
引用数:
h-index:
机构:
王念滨
[
1
]
论文数:
引用数:
h-index:
机构:
黄少滨
[
1
]
论文数:
引用数:
h-index:
机构:
蔄世明
[
2
]
机构
:
[1]
哈尔滨工程大学计算机科学与技术学院
[2]
哈尔滨工业大学计算机科学与技术学院
来源
:
计算机工程
|
2011年
/ 37卷
/ 17期
关键词
:
数据挖掘;
聚类算法;
二分K均值;
并行化;
群集系统;
D O I
:
暂无
中图分类号
:
TP301.6 [算法理论];
学科分类号
:
081202 ;
摘要
:
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。
引用
收藏
页码:23 / 25
页数:3
相关论文
未找到相关数据
未找到相关数据