一种改进的基于BSP的大图计算模型

被引:30
作者
赵翔 [1 ,2 ]
李博 [1 ]
商海川 [3 ]
肖卫东 [1 ,2 ]
机构
[1] 国防科学技术大学信息系统与管理学院
[2] 地球空间信息技术协同创新中心
[3] 东京大学工业科学研究院
基金
湖南省自然科学基金;
关键词
BSP模型; 大图; 水平扩展能力; 图分割; 通用集群;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
伴随大数据的涌现,云存储和计算技术近年得到长足发展.图数据是一种重要而普遍的大数据,在生物信息学、社会网络、化学信息学等领域都有众多应用.因此,大图计算作为大数据分析应用的典型代表,正成为云端负载的重要组成部分.目前,高可扩展性的图计算主要依赖于高性能计算解决方案,需要进行环状(或网状)计算机网络之上的高效全集合通信.然而,在通用计算集群和云计算基础设施上实现基于环状计算机网络的算法时,低效的网络通信将导致巨大的系统延迟.因此,这就要求那些基于云端的大数据计算平台和系统具备十分良好的水平可扩展性.但是,大图的幂律分布和缺乏局部性使得设计一套高度可扩展的大图计算系统变得更具挑战.为此,文中提出了一种面向通用计算集群的可扩展大图计算模型.专注于水平扩展能力,设计了一种新颖的基于分离器-合并器BSP的图计算方法,能够提供原生的负载平衡,仅需很低的通信开销.从而,图数据规模的增大可以通过增加计算节点数量得以解决.最后,在一个图数据通用测试集上,通过大量实验验证了所提模型和方法的有效性和高效性;结果显示,相比经典的以顶点为中心的BSP大图计算模型和其他主流大图计算系统,所提改进的基于BSP的大图计算模型能够提供更好的水平可扩展性.
引用
收藏
页码:223 / 235
页数:13
相关论文
共 7 条
[1]
SpecGraph:基于并发更新的分布式实时图计算模型 [J].
景年强 ;
薛继龙 ;
曲直 ;
杨智 ;
代亚非 .
计算机研究与发展, 2014, (S1) :155-160
[2]
云计算环境下的大规模图数据处理技术 [J].
于戈 ;
谷峪 ;
鲍玉斌 ;
王志刚 .
计算机学报, 2011, 34 (10) :1753-1767
[3]
Collective communication: theory; practice; and experience[J] Ernie Chan;Marcel Heimlich;Avi Purkayastha;Robert van de Geijn Concurrency and Computation: Practice and Experience 2007,
[4]
Performance analysis of MPI collective operations[J] Jelena Pješivac-Grbović;Thara Angskun;George Bosilca;Graham E. Fagg;Edgar Gabriel;Jack J. Dongarra Cluster computing 2007,
[5]
Graph structure in the Web[J] Andrei Broder;Ravi Kumar;Farzin Maghoul;Prabhakar Raghavan;Sridhar Rajagopalan;Raymie Stata;Andrew Tomkins;Janet Wiener Computer Networks 2000,
[6]
A bridging model for parallel computation[J] Leslie G. Valiant Communications of the ACM 1990,
[7]
GraphLab:a new parallel framework for machine learning Y. Low;J. Gonzalez;A. Kyrola; et al; Proceedings of the 26th Conference on Uncertainty in Artificial Intelligence 2010,