计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (17): 187-194.DOI: 10.3778/j.issn.1002-8331.2205-0543
李熙莹,全峰玮,叶芝桧
LI Xiying, QUAN Fengwei, YE Zhihui
摘要: 为了应对车型精细识别中数据分布不均衡导致训练中头部类别过拟合,而尾部类别被忽略的问题,提出了一种基于混合类别均衡损失的车型精细识别数据增强方法。结合Mixup数据增强方法和类别均衡损失,提出混合类别均衡交叉熵损失函数;通过均衡子集微调的训练策略,进一步提高了长尾分布数据的识别效果。实验结果表明,算法在Stanford Cars、CompCars、SYSU Cars数据集上的识别准确率分别比Baseline提高了1.07、0.17和1.58个百分点,有效地缓解了因车型数据不均衡带来的问题,进一步提高了车型精细识别的识别效果。其中SYSU Cars为自建数据集,由66?137张车辆正脸图片构成,包含102种品牌,691种车型以及不同的光照条件(即将在OpenITS上公开)。