计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (9): 148-153.DOI: 10.3778/j.issn.1002-8331.2001-0367
包志强,邢瑜,吕少卿,黄琼丹
BAO Zhiqiang, XING Yu, LYU Shaoqing, HUANG Qiongdan
摘要:
针对目标的三维姿态估计,结合基于深度学习的目标检测模型,提出一种基于改进YOLO V2的6D目标姿态估计算法。通过卷积神经网络提取一幅RGB图像中目标的特征信息;在2D检测的基础上将目标的位置信息映射到三维空间;利用点到点的映射关系在三维空间匹配并计算目标的自由度,进而估计目标的6D姿态。该算法不仅能检测单幅RGB图像中的目标,还可以预测目标的6D姿态,同时不需要额外的后处理过程。实验表明,该算法在LineMod和Occlusion LineMod数据集上的性能优于最近提出的其他基于CNN的方法,在Titan X GPU上的运行速度是37?frame/s,适合实时处理。