计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (16): 212-222.DOI: 10.3778/j.issn.1002-8331.2304-0251
袁磊,唐海,陈彦蓉,高刃,吴文欢
YUAN Lei, TANG Hai, CHEN Yanrong, GAO Ren, WU Wenhuan
摘要: 为解决复杂环境下道路目标检测任务中由于目标尺度变化多样、密集遮挡以及光照不均匀等导致的漏检问题,提出了一种基于YOLOv5的道路目标检测改进方法CTC-YOLO(contextual transformer and convolutional block attention module based on YOLOv5)。针对小目标,改进网络检测头结构,增加多尺度目标检测层,提高小目标检测精度。为了充分利用输入的上下文信息,在特征提取部分引入上下文变换模块(contextual transformer networks,CoTNet),设计了CoT3模块,引导动态注意力矩阵学习,提高视觉表征能力。在Neck部分的C3模块集成卷积块注意力模型(convolutional block attention module,CBAM),以在各种复杂的场景中找到注意力区域。为进一步验证CTC-YOLO方法,采取了一些有用的策略,如模型集成位置选择和对比其他注意力机制。实验结果表明,在公开数据集KITTI、Cityscapes以及BDD100K上mAP@0.5分别达到89.6%、46.1%和57.0%,相较基线模型分别提高3.1个百分点、2.0个百分点和1.2个百分点。与其他模型相比,检测效率更高,有效改善了复杂环境中的目标检测问题。