计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (1): 98-105.DOI: 10.3778/j.issn.1002-8331.1810-0087
朱松杰,娄渊胜,叶枫,李凌,陈勇
ZHU Songjie, LOU Yuansheng, YE Feng, LI Ling, CHEN Yong
摘要: 为了实现对海量数据的高效存储和查询,众多NoSQL数据库被开发出来,HBase是其中之一。但原生的HBase数据库在进行数据查询时只支持主键索引,对非主键数据只能通过全表扫描的方式进行查询,极大降低了HBase的多条件查询速度。为此,提出了基于协处理器的HBase内存索引构建方案,通过协处理器实现对二级索引的快速构建并可根据HBase表的变化自动更新索引。同时,将建立的索引进行持久化操作,在使用时通过内存计算,极大地提高了索引数据检索速度,保证了索引的可用性和容错性。实验结果表明,该方案相比原生数据库的条件检索速度有了极大提升,相比于基于Solr和HiBase的二级索引方案检索速度也有所提升。