云计算中Hadoop技术研究与应用综述

被引:72
作者
夏靖波
韦泽鲲
付凯
陈珍
机构
[1] 空军工程大学信息与导航学院
关键词
云计算; 大数据; Hadoop; Spark; MapReduce;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Hadoop作为当今云计算与大数据时代背景下最热门的技术之一,其相关生态圈与Spark技术的结合一同影响着学术发展和商业模式。首先介绍了Hadoop的起源和优势,阐明相关技术原理,如MapReduce,HDFS,YARN,Spark等;然后着重分析了当前Hadoop学术研究成果,从MapReduce算法的改进与创新、HDFS技术的优化与创新、二次开发与其它技术相结合、应用领域创新与实践4个方面进行总结,并简述了国内外应用现状。而Hadoop与Spark结合是未来的趋势,最后展望了Hadoop未来研究的发展方向和亟需解决的问题。
引用
收藏
页码:6 / 11+48 +48
页数:7
相关论文
共 16 条
[1]  
The HaLoop approach to large-scale iterative data analysis.[J].Yingyi Bu;Bill Howe;Magdalena Balazinska;Michael Ernst.The VLDB Journal.2012, 2
[2]  
Hadoop核心技术.[M].翟周伟.机械工业出版社.2015,
[3]  
Spark大数据处理.[M].高彦杰.机械工业出版社.2014,
[4]  
Hadoop大数据处理.[M].刘军; 编著.人民邮电出版社.2013,
[5]  
MapReduce 2.0源码分析与编程实战.[M].王晓华; 著.人民邮电出版社.2013,
[6]   基于范德蒙码的HDFS优化存储策略研究 [J].
宋宝燕 ;
王俊陆 ;
王妍 .
计算机学报, 2015, 38 (09) :1825-1837
[7]   基于Spark的大数据混合计算模型 [J].
胡俊 ;
胡贤德 ;
程家兴 .
计算机系统应用, 2015, 24 (04) :214-218
[8]   一种基于混合索引的HDFS小文件存储策略 [J].
熊安萍 ;
黄容 ;
邹洋 .
重庆邮电大学学报(自然科学版), 2015, 27 (01) :97-102
[9]  
Banian: A Cross-Platform Interactive Query System for Structured Big Data.[J].Tao Xu;Dongsheng Wang;Guodong Liu;.Tsinghua Science and Technology.2015, 01
[10]   多层一致性哈希的HDFS副本放置策略 [J].
席屏 ;
薛峰 .
计算机系统应用, 2015, 24 (02) :127-133