计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (11): 79-84.DOI: 10.3778/j.issn.1002-8331.1603-0223
褚龙现1,3,李晓英2,3,陈 旭3,楚纯洁4
CHU Longxian1,3, LI Xiaoying2,3, CHEN Xu3, CHU Chunjie4
摘要: 分析了HBase的存储模型和Spark的并行处理机制,提出一种矢量空间数据的分布式存储、索引和并行区域查询方法。设计了基于空间对象中心点的行键存储方案,将中心点的Hilbert编码与经纬度小数位结合实现行键的唯一性,保证地理位置接近的要素在表中存储在相邻的行。实现了基于Spark的空间索引并行构建和区域查询方法,借助空间对象中心点的Hilbert编码快速构建索引,通过多边形区域的最小外接矩形过滤查询结果。实验结果表明,索引并行构建可靠性好速度快,区域查询并行处理算法可行且效率高。