一种优化MapReduce系统能耗的任务分发算法

被引:32
作者
宋杰 [1 ]
徐澍 [1 ]
郭朝鹏 [1 ]
鲍玉斌 [2 ]
于戈 [2 ]
机构
[1] 东北大学软件学院
[2] 东北大学信息科学与工程学院
基金
中国博士后科学基金;
关键词
MapReduce; 能耗; 能耗优化; 任务分发; 并行性; 云计算; 大数据;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
MapReduce是一种典型的分布式计算模型,一经提出就被迅速应用到大数据处理系统中.文中认为MapReduce系统在能耗方面存在优化空间.对于一个分布式并行计算系统,任务的并行性对任务执行性能影响显著,并行性保证方法在优化性能的前提下还应该考虑系统能耗.在MapReduce系统中,传统的Map任务分发算法采用"小任务多次分发的策略",这种策略虽然保证了并行性,但会浪费节点的处理能力,消耗额外的能量;而Reduce任务分发算法尚不能保证Reduce任务间的并行性.文中提出通过动态地调整Map任务和Reduce任务大小,也即任务处理数据量的规模来保证任务并行性,降低MapReduce系统的整体能耗.文中通过实验证明该方法能够有效地降低典型MapReduce作业的能耗.
引用
收藏
页码:323 / 338
页数:16
相关论文
共 11 条
[1]
Hadoop MapReduce短作业执行性能优化 [J].
顾荣 ;
严金双 ;
杨晓亮 ;
袁春风 ;
黄宜华 .
计算机研究与发展, 2014, 51 (06) :1270-1280
[2]
MapReduce优化技术综述 [J].
黄山 ;
王波涛 ;
王国仁 ;
于戈 ;
李佳佳 .
计算机科学与探索 , 2013, (10) :885-905
[3]
MapReduce框架下基于R-树的k-近邻连接算法 [J].
刘义 ;
景宁 ;
陈荦 ;
熊伟 .
软件学报, 2013, 24 (08) :1836-1851
[4]
云数据管理系统能耗基准测试与分析 [J].
宋杰 ;
李甜甜 ;
朱志良 ;
鲍玉斌 ;
于戈 .
计算机学报, 2013, 36 (07) :1485-1499
[5]
架构大数据:挑战、现状与展望 [J].
王珊 ;
王会举 ;
覃雄派 ;
周烜 .
计算机学报, 2011, 34 (10) :1741-1752
[6]
基于CSP的构件化嵌入式软件能耗分析与评估方法研究 [J].
张滕滕 ;
吴晓 ;
李长德 ;
董云卫 .
计算机学报, 2009, 32 (09) :1876-1883
[7]
分布式实时嵌入式系统的能耗建模与分析 [J].
陈丽琼 ;
邵志清 ;
范贵生 .
华东理工大学学报(自然科学版), 2009, 35 (02) :250-255
[8]
MapReduce模型在Hadoop中的性能优化及改进 [D]. 
何荣波 .
北京化工大学,
2011
[9]
Study on energy-consumption regularities of cloud computing systems by a novel evaluation model [J].
Song, Jie ;
Li, Tiantian ;
Wang, Zhi ;
Zhu, Zhiliang .
COMPUTING, 2013, 95 (04) :269-287
[10]
On the energy (In)efficiency of Hadoop clusters [J].
Leverich J. ;
Kozyrakis C. .
Operating Systems Review (ACM), 2010, 44 (01) :61-65