基于Fisher判别的分布式K-Means聚类算法

被引:7
作者
彭长生
机构
[1] 江苏大学计算机科学与通信工程学院
关键词
P2P网络; 聚类算法; 分布式聚类; Fisher线性判别; 置信半径;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
为了解决集中式聚类算法不能处理海量大数据的问题,提出基于Fisher判别确定置信半径的分布式聚类算法.应用网络上各个节点的计算、存储能力,以及网络的带宽,将聚类所需的时间复杂度和空间复杂度平摊到各个节点.通过应用Fisher线性判别找到节点在同一子类数据上的稠密和稀疏分布,从而快速确定聚类的置信半径并指导下一步的聚类过程,使得保持聚类精度的同时能提高分布式聚类的速度.对算法进行了数值模拟,并使用真实数据完成了试验.结果表明,所提出算法相比DFEKM聚类算法,能根据数据分布的不同在聚类结果和聚类速度上达到很好的平衡,这表明该算法具有更好的健壮性.
引用
收藏
页码:422 / 427
页数:6
相关论文
共 8 条
[1]   移动对等网络覆盖网 [J].
张国印 ;
李军 .
软件学报, 2013, 24 (01) :139-152
[2]   基于MapReduce的分布式近邻传播聚类算法 [J].
鲁伟明 ;
杜晨阳 ;
魏宝刚 ;
沈春辉 ;
叶振超 .
计算机研究与发展, 2012, (08) :1762-1772
[3]   无线传感器网络跨层自适应周期分簇路由模型 [J].
徐楠 ;
孙亚民 ;
黄波 ;
于继明 .
计算机科学, 2011, 38 (05) :56-59+78
[4]   k-DmeansWM:一种基于P2P网络的分布式聚类算法 [J].
李榴 ;
唐九阳 ;
葛斌 ;
肖卫东 ;
汤大权 .
计算机科学, 2010, 37 (01) :39-41
[5]   基于高斯混合密度模型的医学图像聚类方法 [J].
宋余庆 ;
王春红 ;
陈健美 ;
谢从华 .
江苏大学学报(自然科学版), 2009, 30 (03) :293-296
[6]   利用集合差异度实现基于内容聚类的P2P搜索模型 [J].
王菁 ;
张焕杰 ;
杨寿保 ;
高鹰 .
中国科学院研究生院学报, 2007, (02) :241-247
[7]  
分布式聚类算法研究与应用.[D].杜晨阳.浙江大学.2011, 07
[8]  
模式分类.[M].(美)RichardO.Duda等著;李宏东;姚天翔等译;.机械工业出版社.2003,