计算机工程与应用 ›› 2026, Vol. 62 ›› Issue (8): 93-104.DOI: 10.3778/j.issn.1002-8331.2507-0309
郭杰,胡建龙+,张俊超,王宇翔,张心译
GUO Jie, HU Jianlong+, ZHANG Junchao, WANG Yuxiang, ZHANG Xinyi
摘要: 针对无人机航拍图像中目标尺寸小、特征模糊且易被遮挡等问题,提出一种改进RT-DETR的无人机图像小目标检测算法,以提升其在复杂场景下的检测精度与鲁棒性。在主干网络中设计特征增强模块(C2f synergistic multi-attention Transformer,C2f_SMT),通过结合SMA(synergistic multi-attention)机制与Transformer结构,有效融合浅层细节特征与高层语义信息,增强了模型对小目标的特征表达能力。为优化特征交互效率,提出双注意力特征交互机制(dual-attention feature interaction,DAFI),该机制采用并行化轻量结构设计,在降低模型复杂度的同时,保留了全局特征建模能力。针对多尺度融合过程中小目标特征易被忽略的问题,引入多尺度特征融合模块(cross-OmniKernel and small-target preservation feature fusion module,COSPFM),以改进特征融合方式,强化了小目标的多尺度感知能力。实验结果表明,改进模型在VisDrone2019数据集上取得了mAP@0.5为51.0%、mAP@0.5:0.95为31.5%的检测性能,分别较基准模型RT-DETR提升了3.1和2.2个百分点。同时,为验证模型的泛化能力,将改进算法迁移至UAVDT数据集进行测试,该模型在各类交通目标(如car、truck、bus)上的检测精度均取得明显提升,平均精度均值mAP@0.5达34.4%,进一步验证了所提方法在多场景小目标检测任务中的有效性与泛化能力。