基于最小生成树聚类算法在云计算平台下的设计与实现

被引:2
作者
孔世明
机构
[1] 重庆文理学院软件工程学院
关键词
最小生成树; 聚类算法; MapReduce; 分布式; 云计算;
D O I
10.13774/j.cnki.kjtb.2013.08.044
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
当今社会随着数据的指数级增加,原有的数据挖掘算法不能有效、快速地完成聚类。本文针对海量数据,提出了基于云计算平台的最小生成树聚类算法。该算法是使用MapReduce分布式计算框架设计并实施的。本文提出的算法能够分布式完成最小生成树聚类算法,并且保证不会影响聚类的结果。实验表明,本文提出的算法具有很好的高效性,与传统算法相比在运行时间上有着明显得提高。
引用
收藏
页码:100 / 102
页数:3
相关论文
共 6 条
  • [1] EFFICIENT ALGORITHMS FOR FINDING MINIMUM SPANNING-TREES IN UNDIRECTED AND DIRECTED-GRAPHS
    GABOW, HN
    GALIL, Z
    SPENCER, T
    TARJAN, RE
    [J]. COMBINATORICA, 1986, 6 (02) : 109 - 122
  • [2] 基于模糊聚类的旅游资源评估系统
    傅培华
    [J]. 科技通报, 2003, (05) : 392 - 394
  • [3] 数据挖掘[M]. 机械工业出版社 , (加)JiaweiHan,(加)MichelineKamber著, 2001
  • [4] Practical parallel algorithms forminimum spanning trees. F Dehne,S G¨otz. Workshop on Advances inParallel and Distributed Systems . 1998
  • [5] Clusteringalgorithms based on minimum and maximum spanningtrees. T Asano,B Bhattacharya,M Keil,F Yao. Proceedings of the 4th Annual SymposiumonComputational Geometry . 1988
  • [6] MapReduce:Simplied Data Pro-cessing on Large Clusters. Dean J,Ghemawat S. Proceedings of the 6thSymp.Operating System Design and Implementation (OS-DI04) . 2004