基于MapReduce的K-means聚类集成

被引:8
作者
冀素琴
石洪波
机构
[1] 山西财经大学信息管理学院
关键词
海量数据; 聚类; MapReduce框架; K-means算法; 共协关系矩阵; 聚类集成;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验结果表明,该算法能够有效地改善聚类质量,具有良好的扩展性,适用于海量数据的聚类分析。
引用
收藏
页码:84 / 87
页数:4
相关论文
共 9 条
[1]  
Clustering aggregation by probability accumulation.[J].Xi Wang;Chunyu Yang;Jie Zhou.Pattern Recognition.2008, 5
[2]   Clusterer ensemble [J].
Zhou, ZH ;
Tang, W .
KNOWLEDGE-BASED SYSTEMS, 2006, 19 (01) :77-83
[3]   MapReduce:新型的分布式并行计算编程模型 [J].
李成华 ;
张新访 ;
金海 ;
向文 .
计算机工程与科学, 2011, 33 (03) :129-135
[4]   聚类集成方法研究 [J].
杨草原 ;
刘大有 ;
杨博 ;
池淑珍 ;
金弟 .
计算机科学, 2011, 38 (02) :166-170
[5]   基于数学形态学的聚类集成算法 [J].
罗会兰 ;
危辉 .
计算机科学, 2010, 37 (08) :214-218
[6]   基于隐含变量的聚类集成模型 [J].
王红军 ;
李志蜀 ;
成飏 ;
周鹏 ;
周维 .
软件学报, 2009, 20 (04) :825-833
[7]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[8]  
聚类集成算法及应用研究.[D].刘秉义.南京理工大学.2012, 07
[9]  
聚类算法及基于簇模式聚类集成研究.[D].耿锦威.安徽大学.2011, 04