曙光5000高性能计算机Barrier网络的设计

被引:2
作者
曹政
王达伟
刘新春
孙凝晖
机构
[1] 中国科学院计算技术研究所
关键词
高性能计算机; 多级互联网络; 胖树; Barrier; 同步; 归约; 分发; 可靠;
D O I
暂无
中图分类号
TP393.02 [];
学科分类号
081201 ; 1201 ;
摘要
为优化Barrier操作的性能,提高大规模并行计算应用在曙光5000系统中的执行效率,文中提出了一种基于硬件的Barrier加速设计.该设计是采用树形Barrier算法,通过增强曙光5000互联网络交换芯片的功能,实现低延迟、可扩展、高可靠和可管理的Barrier网络.该网络支持并发16个Barrier操作,可在Fat-Tree拓扑环境下实现较低的Barrier操作延迟.相比已有实现,是更适合Fat-Tree拓扑的设计方案.理想情况下,1024个节点的同步操作在1.7μs内完成.根据Barrier操作归约和分发过程的特点,分别采用请求应答和超时催促两种机制,为Barrier操作的可靠性提供保障.以该设计实现的Barrier网络原型系统已通过FPGA验证.
引用
收藏
页码:1727 / 1736
页数:10
相关论文
共 3 条
[1]  
Fast, contention-free combining tree barriers for shared-memory multiprocessors[J] . Michael L. Scott,John M. Mellor-Crummey.International Journal of Parallel Programming . 1994 (4)
[2]  
Two algorithms for barrier synchronization[J] . Debra Hensgen,Raphael Finkel,Udi Manber.International Journal of Parallel Programming . 1988 (1)
[3]   THE BUTTERFLY BARRIER [J].
BROOKS, ED .
INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING, 1986, 15 (04) :295-307