基于节点数据密度的分布式K-means聚类算法研究

被引:4
作者
张科泽
杨鹤标
沈项军
蒋中秋
机构
[1] 江苏大学计算机科学与通信工程学院
关键词
点对点技术; K-means聚类; 自适应; 置信半径;
D O I
暂无
中图分类号
TP393.02 [];
学科分类号
摘要
P2P(peer-to-peer)网络分布式聚类算法是利用P2P网络上各个节点的计算、存储能力以及网络的带宽,将算法的时间复杂度和空间复杂度平摊到各个节点,使处理和分析海量分布式数据成为可能,从而克服传统基于单个服务器的集中式聚类算法在数据处理能力等方面的限制。提出一种基于节点置信半径的分布式K-means聚类算法,该算法通过计算节点上数据分布的密度,找到同一类数据在节点的稠密和稀疏分布,从而确定聚类置信半径并指导下一步的聚类。实验表明,该算法能够有效地减少迭代次数,节省网络带宽;同时聚类结果也接近集中式聚类算法的结果。
引用
收藏
页码:3643 / 3645+3655 +3655
页数:4
相关论文
共 6 条
[1]   k-DmeansWM:一种基于P2P网络的分布式聚类算法 [J].
李榴 ;
唐九阳 ;
葛斌 ;
肖卫东 ;
汤大权 .
计算机科学, 2010, 37 (01) :39-41
[2]   Fast and exact out-of-core and distributed k-means clustering [J].
Jin, Ruoming ;
Goswami, Anjan ;
Agrawal, Gagan .
KNOWLEDGE AND INFORMATION SYSTEMS, 2006, 10 (01) :17-40
[3]  
RACHET: An Efficient Cover-Based Merging of Clustering Hierarchies from Distributed Datasets[J] . Nagiza F. Samatova,George Ostrouchov,Al Geist,Anatoli V. Melechko.Distributed and Parallel Databases . 2002 (2)
[4]   Distributed Clustering Using Collective Principal Component Analysis [J].
Hillol Kargupta ;
Weiyun Huang ;
Krishnamoorthy Sivakumar ;
Erik Johnson .
Knowledge and Information Systems, 2001, 3 (4) :422-448
[5]  
Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn.ACM Computing Surveys (CSUR) . 1999 (3)
[6]  
DK-Means———分布式聚类算法K-Dmeans的改进 .2 郑苗苗,吉根林. 计算机研究与发展 . 2007