基于云计算平台Hadoop的并行k-means聚类算法设计研究

被引:84
作者
赵卫中 [1 ,2 ]
马慧芳 [3 ,2 ]
傅燕翔 [4 ]
史忠植 [2 ]
机构
[1] 湘潭大学信息工程学院
[2] 中国科学院计算技术研究所智能信息处理重点实验室
[3] 西北师范大学数学与信息科学学院
[4] 湘潭大学机械工程学院
关键词
云计算; Hadoop平台; 并行k-means; MapReduce;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等。深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略。在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘。
引用
收藏
页码:166 / 168+176 +176
页数:4
相关论文
共 2 条