一种基于Hadoop云计算平台大数据聚类算法设计

被引:3
作者
司福明
卜天然
机构
[1] 安徽机电职业技术学院信息工程系
关键词
Hadoop; 云计算平台; 大数据; 聚类挖掘算法; 并行化;
D O I
10.13877/j.cnki.cn22-1284.2016.04.003
中图分类号
TP311.13 [];
学科分类号
摘要
为了提高聚类的准确度,对传统聚类挖掘算法进行分析、改进和优化,在云计算Hadoop平台上进行DBIK-means算法的并行化,降低了算法的时间复杂度,提高了计算效率.通过实验验证,结果表明DBIK-means算法具有高效、准确、稳定、安全等特性,适合大规模数据集的聚类挖掘.
引用
收藏
页码:9 / 12+65 +65
页数:5
相关论文
共 4 条
[1]
一种基于密度的K-means算法研究 [J].
张琳 ;
陈燕 ;
汲业 ;
张金松 .
计算机应用研究, 2011, 28 (11) :4071-4073+4085
[2]
聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[3]
无线传感网络机器人定位导航在减灾救灾中的应用 [D]. 
石伟 .
北京邮电大学,
2012
[4]
Bigtable.[J].Fay Chang;Jeffrey Dean;Sanjay Ghemawat;Wilson C. Hsieh;Deborah A. Wallach;Mike Burrows;Tushar Chandra;Andrew Fikes;Robert E. Gruber.ACM Transactions on Computer Systems (TOCS).2008, 2