探讨在集群环境下,如何设计并行聚类算法。作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈。所以在集群环境下,设计并行聚类算法时,应采用数据并行的思想。从理论上,对采用数据并行思想后,影响聚类算法的加速比和聚类质量的因素进行了分析,然后通过一个验证算法PCIT(Parallel clustering algorithm based on Index Tree)证实了理论分析的正确性。研究结果可以为以后设计更好的数据并行聚类算法提供理论依据。
ParaStation: Efficient parallel computing by clustering workstations: Design and evaluation.[J].Thomas M. Warschko;Joachim M. Blum;Walter F. Tichy.Journal of Systems Architecture.1998, 3
ParaStation: Efficient parallel computing by clustering workstations: Design and evaluation.[J].Thomas M. Warschko;Joachim M. Blum;Walter F. Tichy.Journal of Systems Architecture.1998, 3