计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (10): 233-239.DOI: 10.3778/j.issn.1002-8331.1810-0018
康家兴,牛保宁,郝晋瑶
KANG Jiaxing, NIU Baoning, HAO Jinyao
摘要: 城市时空热点指城市居民来往次数较多且交通流量较大的时空区域。确定城市时空热点在城市基础设施建设、交通规划、商铺选址、打击犯罪等公共服务领域有大量的应用。目前的热点检测通常是在收集到的全部出租车轨迹上,采用Getis-Ord统计学方法,把轨迹按照时空立方单元进行划分,计算所有轨迹数据覆盖下的热点单元,作为城市时空热点。由于积累的轨迹数量庞大且计算复杂,现有检测算法的重点放在了如何应对海量的数据上。但随着实际应用的扩展,很多需求下的热点检测不需要用到全部数据,适当的数据组织可以使热点检测变得高效。针对实际应用的需要,时空热点查询可以按照用户指定参数(地理范围、日期范围、城市热点大小和时间组织方式),计算时空区域的热度,返回TOP-K热度单元作为时空热点。针对不同的查询参数,时空热点查询需要处理的数据不同,小粒度三维网格索引的轨迹数据组织方法能够快速提取需要处理的轨迹数据。用纽约市出租车轨迹数据集在Spark集群进行查询实验,结果证明这样的索引方法和存储策略能够满足指定参数,并大幅减少查询响应时间。