基于HBase的气象地面分钟数据分布式存储系统

被引:25
作者
陈东辉
曾乐
梁中军
肖卫青
机构
[1] 国家气象信息中心系统工程室
关键词
分钟数据; 分布式存储; Hadoop; solr; HBase; 辅助索引;
D O I
暂无
中图分类号
TP333 [存贮器]; TP311.13 [];
学科分类号
1201 ;
摘要
针对气象地面分钟数据要素多样、信息量大、产生频次高等特点,传统的关系型数据库系统在存储和管理数据上出现负载饱满、读写性能不理想等问题。结合对分布式数据库HBase的存储模型的研究,行主键(row key)采用时间加站号的方式设计了气象分钟数据存储结构模型,实现对海量气象数据的分布式存储和元信息管理。对HBase的唯一索引在面对气象业务的复杂查询用例时响应时间过长的问题,使用搜索引擎solr提供的API接口并参考气象业务中的查询用例对相关字段建立辅助索引,来满足业务检索时效。实验结果表明,该系统具有很好的存储能力和检索效率,入库效率最高可达每秒34000条,并且在常规查询用例的结果返回时效达到毫秒级,能够满足大规模气象数据在业务应用中对存储和查询时效的性能要求。
引用
收藏
页码:2617 / 2621
页数:5
相关论文
共 8 条
  • [1] Hadoop云计算基础架构的搭建和hbase和hive的整合应用[J].谭洁清,毛锡军. 贵州科学.2013(05)
  • [2] 一种基于HBase的高效空间关键字查询策略[J].张榆,马友忠,孟小峰. 小型微型计算机系统.2012(10)
  • [3] 面向智能电网的云数据处理系统评价方法[J].刘越,王晶华,虎嵩林. 微电子学与计算机.2011(08)
  • [4] 云计算:系统实例与研究现状[J].陈康,郑纬民. 软件学报.2009(05)
  • [5] 一种安全可靠的分布式气象数据库系统设计[J].赵伟,脱宇峰,杨银娟,蒋南,杜衍富. 应用气象学报.2006(02)
  • [6] XSemantic:基于语义扩展的XML关键字检索技术研究[D].王先胜.复旦大学.2010
  • [7] 基于Hadoop平台的通信数据分布式查询算法的设计与实现[D].陈勇.北京交通大学.2009
  • [8] 基于Hadoop的海量数据处理模型研究和应用[D].朱珠.北京邮电大学.2008