结合多注意力机制与时空图卷积网络的人体动作识别方法

被引:37
作者
李炫烨
郝兴伟
贾金公
周元峰
机构
[1] 山东大学软件学院
关键词
动作识别; 图卷积网络; 三维人体骨架;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
人体动作识别因其难以结合时空域信息成为计算机视觉方向中一项具有挑战性的任务.提出一个多注意力时空图卷积网络,其核心思想是根据时间序列信息和人体骨架的自然连接构建一个连通图,然后利用具有多注意力机制的时空图卷积网络自动地学习空间和时间特征并且优化该连通图,最后实现对人体动作的预测.引入图注意力模块,模型构建的图的拓扑结构在初始化后会随着网络训练的过程进行优化,最终得到更适合表达人体动作的拓扑结构.此外,加入通道注意力模块,使网络能够更加注意相对重要的通道信息,从而提取更有效描述动作的特征.在公认的大型数据集NTU-RGBD和Kinetics上进行了大量的实验,结果表明该方法具有更高的识别准确率.
引用
收藏
页码:1055 / 1063
页数:9
相关论文
共 5 条
[1]
Enhanced skeleton visualization for view invariant human action recognition.[J].Mengyuan Liu;Hong Liu;Chen Chen.Pattern Recognition.2017,
[2]
From handcrafted to learned representations for human action recognition: A survey.[J].Fan Zhu;Ling Shao;Jin Xie;Yi Fang.Image and Vision Computing.2016,
[3]
A survey on still image based human action recognition [J].
Guo, Guodong ;
Lai, Alice .
PATTERN RECOGNITION, 2014, 47 (10) :3343-3361
[4]
A survey on vision-based human action recognition.[J].Ronald Poppe.Image and Vision Computing.2009, 6
[5]
Machine Recognition of Human Activities: A Survey [J].
Turaga, Pavan ;
Chellappa, Rama ;
Subrahmanian, V. S. ;
Udrea, Octavian .
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2008, 18 (11) :1473-1488