面向一种云计算平台的任务调度技术研究

被引:0
作者
李丽英
机构
[1] 湖南大学
关键词
云计算; Hadoop; MapReduce; 数据局部性; 推测执行; CloudSim;
D O I
暂无
年度学位
2011
学位类型
硕士
摘要
随着云计算技术近几年的迅速发展,Hadoop这种处理大规模密集型数据的云计算平台受到国内外大型IT公司、社交网络、全球各大通信运营商等的广泛关注及应用。Hadoop系统可部署在廉价的普通服务器上,能高效并行处理大规模数据集。Hadoop平台有可能由成千上万个节点组成,在这些节点中采用什么样的任务调度技术协同处理各个任务显得尤为重要。一个好的任务调度策略不但能够很大程度上提高任务响应时间和系统吞吐率,也能提高整个集群资源的利用率。因此,任务调度技术的研究对云计算平台的发展具有重要意义。 本文面向云计算平台Hadoop的任务调度技术进行了如下研究: 首先,研究Hadoop平台的基本架构,Hadoop主要由数据存储结构HDFS和任务并行处理模型MapReduce两个部分组成。在其架构的基础上分析了Hadoop的数据存储特性、任务处理流程以及数据流程。详细阐述了Hadoop平台的任务调度技术发展现状,并分析了现有Hadoop平台采用的任务调度算法的特点和局限性。 其次,根据Hadoop数据的存储特性,提出了基于数据局部性对LATE算法的改进策略,在Hadoop平台中分机架考虑任务推测执行的调度问题,选择备份任务推测执行时,优先选择数据存储在请求处理节点上的任务,以及节点所在机架上的任务推测执行;如果没有数据存储在本节点或者本机架的任务需要推测执行,再考虑在其它机架上查找需要推测执行的任务。 再次,利用统计学概率论解决任务等待时间过长影响工作响应时间的情况。根据稀有事件发生概率模型,综合考虑数据局部性优化问题和任务等待本节点或者本机架处理的时间过长反而影响任务响应时间的问题。 最后,在CloudSim仿真平台上模拟Hadoop架构,对不同的任务类型,设定不同的参数值进行仿真实验,分析算法在提高任务本地化处理能力、减少工作响应时间以及优化系统吞吐率等方面较其他算法具有明显优势,基于数据局部性的改进算法解决了Hadoop平台任务调度技术有关数据局部性问题的性能瓶颈。
引用
收藏
页数:67
共 13 条
[1]
基于MapReduce模型单点恢复时阻塞问题的解决方法研究 [J].
张钊宁 ;
彭宇行 .
计算机工程与科学, 2011, 33 (03) :146-151
[2]
云计算技术简述 [J].
戴元顺 .
信息通信技术, 2010, 4 (02) :29-35
[3]
云计算研究进展综述 [J].
张建勋 ;
古志民 ;
郑超 .
计算机应用研究, 2010, 27 (02) :429-433
[4]
异构环境下自适应的Map-Reduce调度 [J].
陈全 ;
邓倩妮 .
计算机工程与科学, 2009, 31(S1) (S1) :168-171+175
[5]
云计算及其关键技术 [J].
陈全 ;
邓倩妮 .
计算机应用, 2009, 29 (09) :2562-2567
[6]
云计算:系统实例与研究现状 [J].
陈康 ;
郑纬民 .
软件学报, 2009, 20 (05) :1337-1348
[7]
网格资源调度算法的负载均衡及性能分析 [J].
王琴 ;
曾文华 ;
史文翀 .
微电子学与计算机, 2006, (10) :201-203+210
[8]
网格计算中任务调度研究综述 [J].
罗红 ;
慕德俊 ;
邓智群 ;
王晓东 .
计算机应用研究, 2005, (05) :16-19
[9]
多处理器系统中的数据局部性及其优化技术研究 [J].
杨学军 ;
戴华东 ;
夏军 .
中国工程科学, 2002, (05) :44-52
[10]
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1