基于MapReduce的并行模糊C均值算法

被引:32
作者
虞倩倩
戴月明
机构
[1] 江南大学物联网工程学院
关键词
模糊C均值; 并行计算; MapReduce编程模型; 数据挖掘; 云计算;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
模糊C均值是一种重要的软聚类算法,针对模糊C均值的随着数据量的增加,时间复杂度过高的缺点,提出了一种基于MapReduce的并行模糊C均值算法。算法重新设计模糊C均值,使其符合MapReduce的基于key/value的编程模型,并行计算数据集到中心点的隶属度,并重新计算出新的聚类中心,提高了模糊C均值处理大容量数据的计算效率。实验结果表明,基于MapReduce的并行模糊C均值算法具有较高的加速比和扩展性。
引用
收藏
页码:133 / 137+151 +151
页数:6
相关论文
共 2 条
[1]
模式识别.[M].[美]J.P.MarquesdeSa著;吴逸飞译;.清华大学出版社.2002,
[2]
MEASURES OF SIMILARITY BETWEEN VAGUE SETS [J].
CHEN, SM .
FUZZY SETS AND SYSTEMS, 1995, 74 (02) :217-223