基于视频的实时多人姿态估计方法

被引:20
作者
闫芬婷
王鹏
吕志刚
丁哲
乔梦雨
机构
[1] 西安工业大学电子信息工程学院
关键词
图像处理; 多人姿态估计; 空间变换网络; 语义信息; 姿态距离;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
针对图像和视频中多人姿态估计存在人体边界框定位不准确、困难关键点检测精度有待提高等问题,设计了一套基于自顶向下框架的实时多人姿态估计模型。首先将深度可分离卷积加入目标检测算法中,提高人体检测器运行速度;然后基于特征金字塔网络结合上下文语义信息,采用在线难例挖掘算法解决困难关键点检测精度低的问题;最后结合空间变换网络与姿态相似度计算,剔除冗余姿态,改善边界框定位准确性。本文提出模型在2017MS COCO Test-dev数据集上的平均检测精度比Mask R-CNN模型提升了14.84%,比RMPE模型提升了2.43%,帧频达到22frame/s。
引用
收藏
页码:97 / 104
页数:8
相关论文
共 4 条
[1]
基于改进Faster R-CNN的空中目标检测 [J].
冯小雨 ;
梅卫 ;
胡大帅 .
光学学报, 2018, 38 (06) :250-258
[2]
视频序列中表情和姿态的双模态情感识别 [J].
姜明星 ;
胡敏 ;
王晓华 ;
任福继 ;
王浩文 .
激光与光电子学进展, 2018, (07) :167-174
[3]
基于YOLO v2的无人机航拍图像定位研究 [J].
魏湧明 ;
全吉成 ;
侯宇青阳 .
激光与光电子学进展, 2017, 54 (11) :101-110
[4]
Mask R-CNN K.He;G.Gkioxari;P.Dollár;et al; IEEE International Conference on Computer Vision 2017,