计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (7): 134-142.DOI: 10.3778/j.issn.1002-8331.2111-0171
吴浩原,熊辛,闵卫东,赵浩宇,汪文翔
WU Haoyuan, XIONG Xin, MIN Weidong, ZHAO Haoyu, WANG Wenxiang
摘要: 近年来,基于图卷积网络的行为识别是计算机视觉领域的研究热点。然而,现有的图卷积行为识别方法忽略了肢体层面的动作特征,使得行为空间特征提取不准确。此外,这些方法缺乏在间隔帧间进行时序动态建模的能力,导致行为时域特征表达不充分。针对上述问题提出一种基于多级特征融合和时域扩展的图卷积网络行为识别方法。该方法通过多级融合模块提取与融合低层次的关节特征和高层次的肢体特征,从而得到判别性更强的多层级空间特征。同时通过时域扩展模块从相邻帧、间隔帧中学习丰富的多尺度时域特征,增强行为特征的时序表达。在三个大型数据集(NTU RGB+D 60、NTU RGB+D 120和Kinetics-Skeleton)上的实验结果表明,所提方法的识别准确度高于现有行为识别方法。