计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (17): 77-84.DOI: 10.3778/j.issn.1002-8331.1609-0027
冯东煜1,2,朱立谷1,2,肖子达1,2,刘 迪1,2
FENG Dongyu1,2, ZHU Ligu1,2, XIAO Zida1,2, LIU Di1,2
摘要: 传统关系型数据库在处理大规模数据应用时暴露出许多难以克服的问题,NoSQL以独有的特点在大数据背景下得到广泛应用。选择快递业寄递大数据应用为背景,研究MongoDB分片集群的数据布局优化方法。介绍基于MongoDB分片集群的快递寄递数据离线分析系统。根据快递运单字段特点研究MongoDB片键策略,提出基于分片标签的连续均匀数据条带化数据布局方法。对提出的数据布局方法进行测试,结果表明采用该方法的MongoDB集群数据均匀分布和统计分析性能均达到较高水平,并且通过扩展集群分片数目可以进一步提升系统性能。