共 17 条
一种基于Hadoop的高效K-Medoids并行算法
被引:4
作者:
王永贵
戴伟
武超
机构:
[1] 辽宁工程技术大学软件工程学院
来源:
关键词:
K-Medoids;
分布式计算;
Hadoop;
并行采样;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
TP311.13 [];
学科分类号:
081202 ;
1201 ;
摘要:
针对传统K-Medoids算法对初始聚类中心敏感、收敛速度慢,以及在大数据环境下所面临的内存容量和CPU处理速度的瓶颈问题,从改进初始中心选择方案和中心替换策略入手,利用Hadoop分布式计算平台结合基于Top K的并行随机采样策略,实现了一种高效稳定的K-Medoids并行算法,并且通过调整Hadoop平台,实现算法的进一步优化。实验证明,改进的K-Medoids算法不仅有良好的加速比,其收敛性和聚类精度均得到了改善。
引用
收藏
页码:47 / 54
页数:8
相关论文