集群环境下的并行聚类算法

被引:19
作者
周兵
沈钧毅
彭勤科
机构
[1] 西安交通大学软件所,西安交通大学软件所,西安交通大学系统所西安,西安,西安
关键词
数据挖掘; 并行聚类; 集群; 通信; 数据并行;
D O I
暂无
中图分类号
TP301 [理论、方法];
学科分类号
080201 [机械制造及其自动化];
摘要
探讨在集群环境下,如何设计并行聚类算法。作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈。所以在集群环境下,设计并行聚类算法时,应采用数据并行的思想。从理论上,对采用数据并行思想后,影响聚类算法的加速比和聚类质量的因素进行了分析,然后通过一个验证算法PCIT(Parallel clustering algorithm based on Index Tree)证实了理论分析的正确性。研究结果可以为以后设计更好的数据并行聚类算法提供理论依据。
引用
收藏
页码:4 / 6
页数:3
相关论文
共 2 条
[1]
On distributing the clustering process [J].
Boutsinas, B ;
Gnardellis, T .
PATTERN RECOGNITION LETTERS, 2002, 23 (08) :999-1008
[2]
ParaStation: Efficient parallel computing by clustering workstations: Design and evaluation.[J].Thomas M. Warschko;Joachim M. Blum;Walter F. Tichy.Journal of Systems Architecture.1998, 3