基于深度学习的实时场景小脸检测方法

doi:10.3778/j.issn.1002-8331.1805-0441

计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (12): 162-168.DOI: 10.3778/j.issn.1002-8331.1805-0441

基于深度学习的实时场景小脸检测方法

叶锋，赵兴文，宫恩来，杭丽君

杭州电子科技大学自动化学院，杭州 310018

出版日期:2019-06-15 发布日期:2019-06-13

Tiny Face Detection Based on Deep Learning Inreal-Time Scenes

YE Feng, ZHAO Xingwen, GONG Enlai, HANG Lijun

College of Automation, Hangzhou Dianzi University, Hangzhou 310018, China

Online:2019-06-15 Published:2019-06-13

摘要/Abstract

摘要： 实时场景下的小脸检测存在检出率低而且回归精度差的问题。通过融合更底层特征进行多尺度级联预测。根据实时场景下的人脸特点生成不同大小和比例的预测框以更好地适应人脸形状。在预测阶段提出了基于IOU判别的soft and hard nms算法，对冗余预测框进行抑制，设置两个阈值将网络生成的预测框划分为低中高三段，对不同段的预测框采取不同的处理以达到精准筛选的目的。最优架构可在两张NVIDIA GTX 1080显卡下的实时视频检测和摄像头检测中获得45 f/s的速度，并且在Wider Face总体验证集上取得82.6%的平均精度。

关键词: 深度学习, 小脸检测, 实时检测, 计算机视觉

Abstract: Tiny face detection in real-time scenes has a low detection rate and poor regression accuracy. This paper further integrates the lower-level feature maps for multi-scale prediction. According to the characteristics of face in real-time scene detection, predicted boxes of different scales are generated to better adapt to human face shape. In the prediction stage, a soft and hard nms algorithm based on Intersection of Union（IOU） discrimination is proposed to suppress the redundant prediction boxes. Two thresholds are set to divide the prediction frame generated by the network into three segments of low, medium and high, and different segments of the prediction boxes are treated differently to achieve accurate suppress. The optimal architecture of the paper can obtain 45 frame per second in real-time video detection and camera detection under two NVIDIA GTX 1080 graphics cards, and achieves an average accuracy of 82.6% on the Wider Face overall validation set.

Key words: deep learning, tiny face detection, real-time detection, computer vision

叶锋，赵兴文，宫恩来，杭丽君. 基于深度学习的实时场景小脸检测方法[J]. 计算机工程与应用, 2019, 55(12): 162-168.

YE Feng, ZHAO Xingwen, GONG Enlai, HANG Lijun. Tiny Face Detection Based on Deep Learning Inreal-Time Scenes[J]. Computer Engineering and Applications, 2019, 55(12): 162-168.

[1]	黄冬宜，杨兵，吴子豪，匡佳一，颜泽明. 用于全市蜂窝流量预测的时空全连接卷积网络[J]. 计算机工程与应用, 2021, 57(9): 168-175.
[2]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[3]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[4]	武文杰，宋文爱，高雪梅，杨吉江，王青，黄丽萍，雷毅. 基于X线的成人OSA计算机辅助诊断综述[J]. 计算机工程与应用, 2021, 57(9): 1-8.
[5]	许昊，张凯，田英杰，种法广，王子超. 深度神经网络图像描述综述[J]. 计算机工程与应用, 2021, 57(9): 9-22.
[6]	冉蓉，徐兴华，邱少华，崔小鹏，欧阳斌. 基于深度卷积神经网络的裂纹检测方法综述[J]. 计算机工程与应用, 2021, 57(9): 23-35.
[7]	李晓筱，胡晓光，王梓强，杜卓群. 基于深度学习的实例分割研究进展[J]. 计算机工程与应用, 2021, 57(9): 60-67.
[8]	李明山，韩清鹏，张天宇，王道累. 改进SSD的安全帽检测方法[J]. 计算机工程与应用, 2021, 57(8): 192-197.
[9]	曾春艳，严康，王志锋，余琰，纪纯妹. 深度学习模型可解释性研究综述[J]. 计算机工程与应用, 2021, 57(8): 1-9.
[10]	许德刚，王露，李凡. 深度学习的典型目标检测算法研究综述[J]. 计算机工程与应用, 2021, 57(8): 10-25.
[11]	蒋斌，钟瑞，张秋闻，张焕龙. 采用深度学习方法的非正面表情识别综述[J]. 计算机工程与应用, 2021, 57(8): 48-61.
[12]	赵圆丽，梁志剑. 基于异核卷积双注意机制的立场检测研究[J]. 计算机工程与应用, 2021, 57(8): 119-125.
[13]	李健，孙大松，张备伟. 结合双编码器与对抗训练的图像修复[J]. 计算机工程与应用, 2021, 57(7): 192-197.
[14]	杨波，陶青川，董沛君. 改进Deeplab v3+网络的手术器械分割方法[J]. 计算机工程与应用, 2021, 57(7): 222-227.
[15]	刘迪，贾金露，赵玉卿，钱育蓉. 基于深度学习的图像去噪方法研究综述[J]. 计算机工程与应用, 2021, 57(7): 1-13.

基于深度学习的实时场景小脸检测方法

Tiny Face Detection Based on Deep Learning Inreal-Time Scenes

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics