计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (14): 249-255.DOI: 10.3778/j.issn.1002-8331.1703-0189
杨树亮,毕硕本,Nkunzimana A,黄 铜,万 蕾
YANG Shuliang, BI Shuoben, Athanase Nkunzimana, HUANG Tong, WAN Lei
摘要: 随着移动定位技术的发展和移动定位设备普及,移动对象轨迹数据分析逐渐成为空间数据挖掘领域的研究热点。基于出租车GPS轨迹数据进行空间聚类研究可以发现出租车移动的热点路径以及运动趋势。在传统OPTICS(Ordering Points To Identify the Clustering Structure)算法的基础上根据轨迹数据的特征提出了适合海量轨迹空间聚类的TR-OPTICS(Trajectory OPTICS)算法。该方法选取出租车轨迹中的载客轨迹为研究对象,经过轨迹特征点选取后采用MDL(Minimum Description Length)方式进行轨迹的二次划分,通过计算子轨迹间的水平距离、垂直距离、角度距离来度量轨迹的相似性。在聚类算法上采用外包矩形作为核心轨迹的搜索邻域,同时重新定义轨迹核心距离与轨迹可达距离,用邻接表代替空间索引来降低算法的复杂度。通过对南京市出租车载客轨迹的聚类分析,得到了出租车载客热点轨迹簇,并且经过多次实验与传统OPTICS算法、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法对比,提出的TR-OPTICS算法在算法执行效率上均优于其他两种算法,在聚类结果上该算法可以发现载客子轨迹簇主要集中在市中心的中央路、大桥南路、北京东路、中山东路、中山北路、建宁路、瑞金路、板仓街、迈皋桥等道路,并且聚类效果优于其他两种算法。结果表明,提出的TR-OPTICS算法提高了算法执行效率,同时也提高了聚类结果的准确性。