Hadoop在气象数据密集型处理领域中的应用

被引:22
作者
肖卫青
杨润芝
胡开喜
林润生
刘立明
谷军霞
机构
[1] 国家气象信息中心
关键词
Hadoop; HDFS; MapReduce; 气象数据; 数据密集型计算;
D O I
10.19517/j.1671-6345.2015.05.008
中图分类号
P413 [数据处理]; P409 [电子计算机在大气科学上的应用];
学科分类号
摘要
气象资料的统计分析计算属于数据密集型计算,目前的处理方式多为单机处理,对大量数据的处理比较慢,难以应对日益增长的数据,对气象资料的研究形成一定的制约。针对数据密集型气象数据的处理,尝试应用Hadoop的MapReduce思想提高计算效率;对Hadoop在处理大量小文件组成的气象数据时的低效率,提出对原始文件进行预处理,将多个小文件整合成能直接用于计算的大文件。试验证明,该方法解决了Hadoop处理大量小文件时的低效率问题,通过与Oracle入库检索的比较,应用Hadoop处理数据密集型气象资料具有实际意义。
引用
收藏
页码:823 / 828
页数:6
相关论文
共 4 条
  • [1] 大量气象数据小文件自适应优化传输
    陆颖华
    马廷淮
    曹浩
    李德泉
    [J]. 应用气象学报, 2014, (05) : 629 - 637
  • [2] 日平均计算方法对气温统计值的影响
    李亚丽
    妙娟利
    贺音
    [J]. 气象科技, 2013, 41 (01) : 88 - 92
  • [3] 地面气象资料质量控制方法研究概述
    刘小宁
    任芝花
    [J]. 气象科技, 2005, (03) : 199 - 203
  • [4] Hadoop权威指南[M]. 清华大学出版社 , (美) 怀特 (White, 2011