基于深度学习的视觉目标检测技术综述

被引:100
作者
曹家乐 [1 ]
李亚利 [2 ]
孙汉卿 [1 ]
谢今 [3 ]
黄凯奇 [4 ]
庞彦伟 [1 ]
机构
[1] 天津大学
[2] 清华大学
[3] 重庆大学
[4] 中国科学院自动化研究所
基金
中国博士后科学基金; 国家重点研发计划;
关键词
视觉目标检测; 深度学习; 单目; 双目; 锚点框;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.41 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 080203 ;
摘要
视觉目标检测旨在定位和识别图像中存在的物体,属于计算机视觉领域的经典任务之一,也是许多计算机视觉任务的前提与基础,在自动驾驶、视频监控等领域具有重要的应用价值,受到研究人员的广泛关注。随着深度学习技术的飞速发展,目标检测取得了巨大的进展。首先,本文总结了深度目标检测在训练和测试过程中的基本流程。训练阶段包括数据预处理、检测网络、标签分配与损失函数计算等过程,测试阶段使用经过训练的检测器生成检测结果并对检测结果进行后处理。然后,回顾基于单目相机的视觉目标检测方法,主要包括基于锚点框的方法、无锚点框的方法和端到端预测的方法等。同时,总结了目标检测中一些常见的子模块设计方法。在基于单目相机的视觉目标检测方法之后,介绍了基于双目相机的视觉目标检测方法。在此基础上,分别对比了单目目标检测和双目目标检测的国内外研究进展情况,并展望了视觉目标检测技术发展趋势。通过总结和分析,希望能够为相关研究人员进行视觉目标检测相关研究提供参考。
引用
收藏
页码:1697 / 1722
页数:26
相关论文
共 25 条
[21]  
Improve object detection with featurebased knowledge distillation:towards accurate and efficient detectors .2 Zhang L F,Ma K S. Proceedings of the 9th International Conference on Learning Representations . 2021
[22]  
Acquisition of localization confidence for accurate object detection .2 Jiang B R,Luo R X,Mao J Y,et al. Proceedings of the 15th European Conference on Computer Vision . 2018
[23]  
Faster R-CNN:towards real-time object detection with region proposal networks .2 Ren S,He K,Girshick R B et al. Neural Information Processing Systems . 2015
[24]   The Pascal Visual Object Classes (VOC) Challenge [J].
Everingham, Mark ;
Van Gool, Luc ;
Williams, Christopher K. I. ;
Winn, John ;
Zisserman, Andrew .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2010, 88 (02) :303-338
[25]   Robust real-time face detection [J].
Viola, P ;
Jones, MJ .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 57 (02) :137-154