计算机工程与应用 ›› 2026, Vol. 62 ›› Issue (6): 122-133.DOI: 10.3778/j.issn.1002-8331.2507-0218
陈胜宝,施隆照+
CHEN Shengbao, SHI Longzhao+
摘要: 针对边缘端设备资源受限和行人检测算法在小目标物体、多尺度物体和重叠遮挡造成的几何形变物体上检测精度低的问题,提出了一种适合部署在边缘端设备的基于YOLOv8的行人检测算法YOLO-PD。针对小目标物体,设计局部Transformer块(partial Transformer block,PTB),增强模型的特征提取能力,PTB的混合结构在保持高效特征提取的同时还能降低计算成本;针对多尺度物体,设计金字塔共享空洞卷积(pyramid shared dilation convolution,PSDC),利用共享权重参数的多尺度空洞卷积来提高模型多尺度特征提取能力的同时减小模块体积;针对几何形变物体,设计轻量级可变形动态检测头(light deformable dynamic head,LDDH),在检测头中通过动态调整加权因子来提升检测精度、通过可变形卷积来更精准地获取形变物体的特征。实验结果表明,与基线模型YOLOv8n相比,YOLO-PD在自建的行人检测数据集COCO-Person和VOC-Person上的mAP50分别提高了2.9和1.9个百分点,参数量减少了34.3%;在公开的行人检测数据集WidePerson上,mAP50和mAP50:95分别提高了1.8和1.1个百分点。在行人检测任务上该算法检测精度高、泛化能力强、极小的参数量让它适合部署在边缘端设备。