KBAC:一种基于K-means的自适应聚类

被引:6
作者
徐晓旻
肖仰华
机构
[1] 复旦大学计算机科学技术学院
基金
高等学校博士学科点专项科研基金;
关键词
K-means; MapReduce; 聚类; 社团发现;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K-means聚类算法存在的主要不足之处之一在于需要用户指定聚类核数目,在一般应用场景下,用户无法给出合适的聚类核数目.另一方面,K-means聚类所具有的可并行化特点非常适合运用到云计算平台上以处理大规模数据样本的聚类任务.本文提出KBAC算法采用K-means算法作为预聚类过程并在云平台上进行实现和优化,能够自适应确定最佳聚类核数目并进行聚类.其核心思想是将样本空间聚类问题转换为图上社团发现问题.理论和实验证明,通过在云计算框架下实现K-means预聚类过程的并行化,KBAC算法能够高效地对大规模数据进行聚类,并获得高质量的聚类结果.
引用
收藏
页码:2268 / 2272
页数:5
相关论文
共 9 条
[1]   基于MapReduce的Canopy-Kmeans改进算法 [J].
毛典辉 .
计算机工程与应用, 2012, 48 (27) :22-26+68
[2]   基于云计算平台Hadoop的并行k-means聚类算法设计研究 [J].
赵卫中 ;
马慧芳 ;
傅燕翔 ;
史忠植 .
计算机科学, 2011, 38 (10) :166-168+176
[3]   k-means聚类算法的MapReduce并行化实现 [J].
江小平 ;
李成华 ;
向文 ;
张新访 ;
颜海涛 .
华中科技大学学报(自然科学版), 2011, 39 (S1) :120-124
[4]   面向结构稳定性的分裂-合并聚类算法 [J].
雷小锋 ;
何涛 ;
李奎儒 ;
谢昆青 ;
丁世飞 .
计算机科学, 2010, 37 (11) :217-222
[5]   遗传优化的K均值聚类算法 [J].
胡彧 ;
毕晋芝 .
计算机系统应用, 2010, 19 (06) :52-55
[6]   自适应的k-means聚类算法SA-K-means [J].
周慧芳 .
科技创新导报, 2009, (34) :4-5+8
[7]   一种基于K-Means局部最优性的高效聚类算法 [J].
雷小锋 ;
谢昆青 ;
林帆 ;
夏征义 .
软件学报, 2008, (07) :1683-1692
[8]   利用高斯混合模型实现概率密度函数逼近 [J].
袁礼海 ;
李钊 ;
宋建社 .
无线电通信技术, 2007, (02) :20-22
[9]   核聚类算法最佳聚类数的自适应确定方法 [J].
普运伟 ;
朱明 ;
金炜东 ;
胡来招 .
计算机工程, 2007, (04) :11-13