共 9 条
KBAC:一种基于K-means的自适应聚类
被引:6
作者:
徐晓旻
肖仰华
机构:
[1] 复旦大学计算机科学技术学院
来源:
基金:
高等学校博士学科点专项科研基金;
关键词:
K-means;
MapReduce;
聚类;
社团发现;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
K-means聚类算法存在的主要不足之处之一在于需要用户指定聚类核数目,在一般应用场景下,用户无法给出合适的聚类核数目.另一方面,K-means聚类所具有的可并行化特点非常适合运用到云计算平台上以处理大规模数据样本的聚类任务.本文提出KBAC算法采用K-means算法作为预聚类过程并在云平台上进行实现和优化,能够自适应确定最佳聚类核数目并进行聚类.其核心思想是将样本空间聚类问题转换为图上社团发现问题.理论和实验证明,通过在云计算框架下实现K-means预聚类过程的并行化,KBAC算法能够高效地对大规模数据进行聚类,并获得高质量的聚类结果.
引用
收藏
页码:2268 / 2272
页数:5
相关论文