计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (16): 241-247.DOI: 10.3778/j.issn.1002-8331.1905-0259
王晰,袁绍欣
WANG Xi, YUAN Shaoxin
摘要:
从车牌识别数据中可以得到车辆在特定道路与特定时间段的旅行时间数据样本,但样本中往往混有不反映通常交通状况的噪音数据,去除这些噪音数据后可得到能够反映通常交通状况的有价值的有效数据。为此提出算法采用对数正态分布混合模型对数据样本进行拟合,并利用噪音数据具有右向尾部的分布特点给出确定最优子分布数量的两个判据,使两类数据具有最佳的聚类效果,从而能识别和提取出有效数据。算法对噪音数据特征不明显的少量数据样本也给出了提取方法,将第10百分位和第90百分位之间的数据作为有效数据。该算法针对公交车和非公交车两类车型的车牌识别数据进行实验,对噪音数据的识别取得了良好效果。实验结果表明,有效数据提取前后,非公交车通常状况的旅行时间平均值和标准差以及公交车旅行时间标准差具有明显差异,不滤除噪音数据会对两类车通常交通状况下的运行状态产生误判。