一种基于Hadoop的高效K-Medoids并行算法

被引:4
作者
王永贵
戴伟
武超
机构
[1] 辽宁工程技术大学软件工程学院
关键词
K-Medoids; 分布式计算; Hadoop; 并行采样;
D O I
暂无
中图分类号
TP301.6 [算法理论]; TP311.13 [];
学科分类号
081202 ; 1201 ;
摘要
针对传统K-Medoids算法对初始聚类中心敏感、收敛速度慢,以及在大数据环境下所面临的内存容量和CPU处理速度的瓶颈问题,从改进初始中心选择方案和中心替换策略入手,利用Hadoop分布式计算平台结合基于Top K的并行随机采样策略,实现了一种高效稳定的K-Medoids并行算法,并且通过调整Hadoop平台,实现算法的进一步优化。实验证明,改进的K-Medoids算法不仅有良好的加速比,其收敛性和聚类精度均得到了改善。
引用
收藏
页码:47 / 54
页数:8
相关论文
共 17 条
[1]   基于MapReduce的K-means聚类集成 [J].
冀素琴 ;
石洪波 .
计算机工程, 2013, 39 (09) :84-87
[2]   基于MapReduce的ACO-K-means并行聚类算法 [J].
虞倩倩 ;
戴月明 ;
李晶晶 .
计算机工程与应用, 2013, 49 (16) :117-120+136
[3]   基于MapReduce的K-Medoids并行算法 [J].
张雪萍 ;
龚康莉 ;
赵广才 .
计算机应用, 2013, 33 (04) :1023-1025+1035
[4]   基于HBase的并行BFS方法 [J].
强彦 ;
卢军佐 ;
刘涛 ;
裴博 .
计算机科学, 2013, 40 (03) :228-231
[5]   一种改进人工蜂群的K-medoids聚类算法 [J].
李莲 ;
罗可 ;
周博翔 .
计算机工程与应用, 2013, 49 (16) :146-150
[6]   一种新的k-medoids聚类算法 [J].
姚丽娟 ;
罗可 ;
孟颖 .
计算机工程与应用, 2013, 49 (19) :153-157
[7]   一种基于差分演化的K-medoids聚类算法 [J].
孟颖 ;
罗可 ;
刘建华 ;
石爽 .
计算机应用研究, 2012, 29 (05) :1651-1653
[8]   架构大数据:挑战、现状与展望 [J].
王珊 ;
王会举 ;
覃雄派 ;
周烜 .
计算机学报, 2011, 34 (10) :1741-1752
[9]   大数据分析——RDBMS与MapReduce的竞争与共生 [J].
覃雄派 ;
王会举 ;
杜小勇 ;
王珊 .
软件学报, 2012, 23 (01) :32-45
[10]   一种基于ACO的K-medoids聚类算法 [J].
孟颖 ;
罗可 ;
姚丽娟 ;
王琳 .
计算机工程与应用 , 2012, (16) :136-139+152