利用Apache Hadoop进行TB级排序

被引:1
作者
张翼颉 [1 ]
周敏 [2 ]
机构
[1] 苏州工业园区职业技术学院信息工程系
[2] 机械工业苏州技工学校
关键词
Apache Hadoop; 大数据; 分布式计算;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据正以惊人的速度激增。从出现文明到2003年,人类总共才创造5EB的数据,但是我们现在仅在两天内就创造出相同的数据量!到2012年,全球数字数据量将增长至2.72ZB,并以每两年翻番的速度增长,到2015年将达到8ZB。因此大数据的分析和处理现在成为各领域的热点研究方向。而大数据的排序,是大数据分析中的第一步工作。
引用
收藏
页码:25 / 26
页数:2
相关论文
共 3 条
  • [1] Singh S,Estan C,Varghese G,et al.Automated worm fingerprinting. Proceedings of the 6th ACM/USENIX Symposium on Operating System Design and Implementation (OSDI 2004) . 2004
  • [2] S.Ghemawat,H.Gobioff,S.Leung.The Google file system. Proceedings of the nineteenth ACM symposium on Operating systems principles . 2003
  • [3] Dhruba Borthakur.The Hadoop Distributed FileSystem:Architecture and Design. . 2007