一种基于Solr的HBase海量数据二级索引方案

被引:15
作者
王文贤 [1 ,2 ]
陈兴蜀 [1 ,2 ]
王海舟 [1 ,2 ]
吴小松 [2 ]
机构
[1] 四川大学网络空间安全研究院
[2] 四川大学计算机学院网络与可信计算研究所
关键词
HBase; 二级索引; Solr; 快速检索;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
针对HBase不提供二级索引和华为的hindex方案难以满足海量数据检索速度需求的问题,文章设计了基于Solr的HBase二级索引方案SIHBase(Solr Indexing HBase)。该方案使用HBase的Coprocessor(协处理器)为数据表的创建、修改、删除以及数据的插入、更新、删除和恢复等操作都实现了相应的回调函数,通过回调函数向Solr发送相关请求,以实现在Solr中自动为HBase建立和维护二级索引,保证数据与索引的一致性。该方案具有良好的通用性,可以同时为多张表的多列数据建立索引。该方案扩展了HBase的客户端功能,增加了直接查询Solr的接口,利用Solr提供的高效、灵活、多样的检索功能实现对HBase海量数据的快速检索。最后,与hindex进行了二级索引的查询性能对比实验,证明了该方案在查询速度上要远快于hindex。
引用
收藏
页码:39 / 44
页数:6
相关论文
共 9 条
[1]   MS SQL数据库在线取证研究 [J].
刘浩阳 .
信息网络安全, 2016, (09) :26-30
[2]   一种基于数据库服务的密文检索实现 [J].
宋衍 ;
周庆 ;
张国双 ;
王馨 .
信息网络安全, 2015, (09) :10-14
[3]   基于协处理器的HBase区域级第二索引研究与实现 [J].
丁飞 ;
陈长松 ;
张涛 ;
杨涛 ;
张岩峰 .
计算机应用, 2014, 34(S1) (S1) :181-185
[4]   一种基于HBase的高效空间关键字查询策略 [J].
张榆 ;
马友忠 ;
孟小峰 .
小型微型计算机系统, 2012, 33 (10) :2141-2146
[5]  
The Key as Dictionary Compression Method of Inverted Index Table under the Hbase Database.[J].Pengsen Cheng;Junxiu An.Journal of Software.2013, 5
[6]  
基于HBase的数据生成与索引方法的研究.[D].陈新鹏.北京邮电大学.2014, 04
[7]  
非关系型与关系型空间数据库对比分析与协同应用研究.[D].江民彬.首都师范大学.2013, 01
[8]  
基于Lucene的HBase全文检索功能的设计与实现.[D].邹敏昊.南京大学.2013, 08
[9]  
基于HBase的海量数据实时查询系统设计与实现.[D].卓海艺.北京邮电大学.2013, 11