时空数据分布式存储研究

被引:0
作者
施志林
机构
[1] 江西理工大学
关键词
时空数据; 分布式存储; Hadoop; MapReduce; 时空索引;
D O I
暂无
年度学位
2015
学位类型
硕士
导师
摘要
时空数据是一种多维数据。它的结构异常复杂,具有空间和时态特性。它能够详细的记录事物空间状态和时空变化,并能正确显示对象过去、现在、未来的状态。在科技快速发展的时代,采集数据的设备种类越来越多,数据的数量也快速增大,从而导致数据存储管理困难。而时空数据存储管理模块设计实现的优劣决定着整个数据管理系统的工作能力。因此又会影响到其它上层的应用系统运行效率。随着分布式框架的提出,它的高效并行计算能力、大容量存储、高扩展、高稳定等优点吸引着我们。本文在前人研究的基础上对时空数据分布式存储进行了探索研究。本文先从时空数据和分布式理论着手,研究相关部分的技术及原理,提出一种基于R树的时空索引,然后以开源云平台Hadoop的HBase为数据库载体,利用Map Reduce高效计算能力对时空数据进行管理,最后通过一些实验验证索引性能。主要研究内容如下:1)深入地分析了经典时空数据模型及时空索引的优缺点;简要分析了分布式平台的特点及相关技术,为论文研究提供理论和技术支撑。2)系统分析了开源云平台Hadoop的核心组件Map Reduce并行计算框架、HDFS分布式文件存储系统、以HDFS为载体的列式键值数据库HBase的数据模型。针对时空数据数据量大等特点,提出了利用HBase大表来存储管理时空数据。结合时空数据与HBase的特性,详细阐述了建表过程以及如何设计行键、定义列族。3)根据当前出现的时空数据索引,提出了一种在R树的基础上构建时空数据索引,该索引将过去和现在时间的数据分别存储,在各自的树中分别管理着起始及结束时间,提高树的利用率来提高查询效率。最后进行了对比实验,测试本文提出时空索引的插入及查询效率。4)最后通过GPS模拟器生成实验数据,然后存储在HBase进行管理。
引用
收藏
页数:68
共 25 条
[1]
Large-scale indexing of spatial data in distributed repositories: the SD-Rtree [J].
du Mouza, Cedric ;
Litwin, Witold ;
Rigaux, Philippe .
VLDB JOURNAL, 2009, 18 (04) :933-958
[2]
时空数据库新理论.[M].郝忠孝; 著.科学出版社.2011,
[3]
基于HDFS的分布式存储研究与实现 [D]. 
舒康 .
电子科技大学,
2014
[4]
基于云计算的海量时空数据存储及挖掘方法的研究和应用 [D]. 
平利强 .
杭州电子科技大学,
2014
[5]
时空数据的挖掘算法及应用研究 [D]. 
杨睿通 .
西安工程大学,
2012
[6]
基于Hadoop的海量期货数据的分布式存储和算法分析 [D]. 
李勇君 .
天津大学,
2012
[7]
基于基态修正模型的时态GIS系统的研究与设计 [D]. 
王娜 .
大连理工大学,
2006
[8]
基于云计算的大数据存储安全的研究 [J].
洪汉舒 ;
孙知信 .
南京邮电大学学报(自然科学版), 2014, 34 (04) :26-32+56
[9]
大规模时空数据分布式存储方法研究 [J].
钟运琴 ;
方金云 ;
赵晓芳 .
高技术通讯, 2013, 23 (12) :1219-1229
[10]
基于HBase的矢量空间数据分布式存储研究 [J].
范建永 ;
龙明 ;
熊伟 .
地理与地理信息科学 , 2012, (05) :39-42