计算机工程与应用 ›› 2025, Vol. 61 ›› Issue (7): 105-116.DOI: 10.3778/j.issn.1002-8331.2410-0084

• YOLO改进及应用专题 • 上一篇    下一篇

多尺度特征聚合扩散和边缘信息增强的小目标检测算法

江旺玉,王乐,姚叶鹏,毛国君   

  1. 1.福建理工大学 计算机科学与数学学院,福州 350118
    2.福建理工大学 福建省大数据挖掘与应用技术重点实验室,福州 350118
    3.景区交易数据要素化文化和旅游部技术创新中心,福州 350000
    4.中国科学院 信息工程研究所,北京 100084
  • 出版日期:2025-04-01 发布日期:2025-04-01

Multi-Scale Feature Aggregation Diffusion and Edge Information Enhancement Small Object Detection Algorithm

JIANG Wangyu, WANG Le, YAO Yepeng, MAO Guojun   

  1. 1.College of Computer Science and Mathematics, Fujian University of Technology, Fuzhou 350118, China
    2.Fujian Provincial Key Laboratory of Big Data Mining and Applications, Fujian University of Technology, Fuzhou 350118, China
    3.Technology Innovation Center of Factored Transaction Data in Tourist Attractions, Ministry of Culture and Tourism, Fuzhou 350000, China
    4.Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100084, China
  • Online:2025-04-01 Published:2025-04-01

摘要: 无人机航拍图像中,目标尺寸变化剧烈、背景复杂且小目标比例较高等特点为目标检测任务带来巨大挑战。尽管现有的基于卷积的目标检测算法能有效获取空间信息,但在实现不同尺度特征的全局交互及边缘细节信息的有效利用上仍存在不足。因此,提出了一种结合多尺度特征聚合扩散和边缘信息增强的小目标检测算法ADE-YOLO。构建了多尺度特征聚合扩散金字塔网络(MFADPN),通过在中间层聚合不同层级特征,并将其直接扩散至相邻层以缩短传播路径,有效减少了信息在传递过程中的损失,增强了模型的多尺度表达能力,显著提升了对不同尺度目标的检测能力。设计了自适应上下文融合模块(ACFM),利用通道注意力机制自适应地调整不同特征图的贡献,进一步强化多尺度特征的融合效果,使得重要特征在信息融合过程中更加突出。提出的C2f-Sobel模块通过额外分支结合Sobel算子来提取图像的边缘信息,从而为模型提供了更丰富的细节信息,提升了其在复杂场景下目标定位能力。实验结果表明,ADE-YOLO相较于基线YOLOv10s,在VisDrone2019和TinyPerson数据集上分别提高了8.6个百分点和4.0个百分点(mAP0.5),并且在与其他先进模型的对比中也展示了显著的优势。

关键词: 小目标检测, 航拍图像, 特征金字塔, 自适应特征融合, 边缘信息

Abstract: 1.College of Computer Science and Mathematics, Fujian University of Technology, Fuzhou 350118, China
2.Fujian Provincial Key Laboratory of Big Data Mining and Applications, Fujian University of Technology, Fuzhou 350118, China
3.Technology Innovation Center of Factored Transaction Data in Tourist Attractions, Ministry of Culture and Tourism, Fuzhou 350000, China
4.Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100084, China

Key words: small object detection, aerial images, feature pyramid, adaptive feature fusion, edge information