基于Hadoop的云计算模型研究与应用

被引:0
作者
曹风兵
机构
[1] 重庆大学
关键词
云计算; 海量数据; Hadoop; MapReduce;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
随着社会进步和互联网技术发展,网络数据量飞速增长且规模日渐庞大,不管是企业还是个人都面临如何对这些海量数据进行有效存储和分析的难题。面对正在增长的海量数据,传统数据处理方法存在数据存储成本过高、海量数据管理较困难、可靠性较低、效率低下、并行处理程序编写困难等诸多缺点。人们需要一种新的技术思想来解决这些问题。云计算的思想就很自然地被提出来。 云计算通过整合互联网络中的闲散资源,对外提供强大的存储和计算能力,以及一些其它解决方案。Hadoop是一个开源分布式数据处理框架,被用于高效地处理海量数据。由于Hadoop具有可伸缩性、高可靠性、低成本性和高效性等优点,已成为一种流行的云计算开发平台。但是Hadoop也存在一定的缺陷,例如,在Hadoop集群中只要一个名字节点来管理整个文件系统的元数据和执行重要的文件系统操作。这会限制集群的可扩展性、可用性;另外,在传统Hadoop中,计算和存储是紧耦合的,这也会对集群的性能造成限制。 本文的研究课题是基于Hadoop的云计算模型研究与应用,主要目标是:分析传统Hadoop框架的性能瓶颈,设计一种新的Hadoop框架;在改进传统Hadoop框架的基础上,设计基于改进后的Hadoop的云计算模型,实现相应云计算平台,重点解决海量数据存储和分析的难题。 论文的主要工作和成果如下: ①介绍云计算的基础理论,包括云计算的概念、特点、关键技术和典型的平台应用。 ②阐述Hadoop的基础架构,包括分布式文件系统(HDFS)、并行编程模型MapReduce的原理和实现机制、Hadoop框架优化措施等。详细分析了HDFS的数据管理机制、性能保障措施、以及文件的读取和写入过程。 ③分析Hadoop的性能瓶颈,设计了一个新型的Hadoop架构,解决了传统Hadoop架构中的单名字节点的瓶颈问题,以及计算与存储紧耦合问题,通过理论分析和实验对比,论证了新框架的高效性。新框架具有高可用性和良好的可扩展能力。 ④完成了基于改进的Hadoop的云计算模型设计,结合WEB技术实现了云模型中功能模块的开发。 本文云计算模型具有高效性、高可靠性、低成本和易于使用等优点。此系统模型可应用于企业数据存储和计算、科学研究等领域,为海量数据存储和计算提供了高可靠性、低成本的解决方案,为云计算技术的发展和Hadoop应用提供了一种新的思路。
引用
收藏
页数:82
共 21 条
[1]
虚拟化的集群资源管理技术研究 [J].
辛军 ;
陈康 ;
郑纬民 .
计算机科学与探索, 2010, 4 (04) :324-329
[2]
云计算综述与移动云计算的应用研究 [J].
刘越 .
信息通信技术, 2010, 4 (02) :14-20
[3]
云计算体系结构及应用实例分析 [J].
匡胜徽 ;
李勃 .
计算机与数字工程, 2010, 38 (03) :60-63+91
[4]
云计算:从概念到平台 [J].
吴吉义 ;
平玲娣 ;
潘雪增 ;
李卓 .
电信科学, 2009, 25 (12) :23-30
[5]
云计算及其关键技术 [J].
陈全 ;
邓倩妮 .
计算机应用, 2009, 29 (09) :2562-2567
[6]
IBM在华践行“蓝云6+1”计划 [J].
张鹏 .
通信世界, 2009, (20) :52
[7]
与云共舞——微软云计算的新进展 [J].
张亚勤 .
中国计算机用户, 2009, (04) :12-13
[8]
云计算概念和影响力解析 [J].
张健 .
电信网技术, 2009, (01) :15-18
[9]
MapReduce模型的调度及容错机制研究 [J].
孙广中 ;
肖锋 ;
熊曦 .
微电子学与计算机, 2007, (09) :178-180
[10]
云计算的关键技术与应用实例.[M].王鹏著.人民邮电出版社.2010,