基于深度学习的无人机航拍车辆检测

被引:11
作者
赵爽 [1 ,2 ]
黄怀玉 [1 ,2 ]
胡一鸣 [2 ]
娄小平 [1 ]
王欣刚 [2 ]
机构
[1] 北京信息科技大学仪器科学与光电工程学院
[2] 中国科学院自动化研究所精密感知与控制研究中心
关键词
航拍图像; 车辆检测; YOLO v2; 特征融合;
D O I
暂无
中图分类号
U495 [电子计算机在公路运输和公路工程中的应用]; TP391.41 []; TP18 [人工智能理论];
学科分类号
0838 ; 080203 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了解决大尺寸航拍图像下的多尺度车辆检测问题,在YOLO v2检测框架的基础上提出了一种多尺度目标检测算法。首先,将大尺寸航拍图像切分成若干有重叠区域的小图像块;然后,将各图像切片依次输入检测网络,主干网络针对输入图像提取不同尺度的特征,并对3种尺度的特征进行融合以获取不同的感受野,同时解决了浅层特征语义信息不足的问题;最后,各图像块的检测结果通过非极大值抑制的方法进行合并。在实际的航拍车辆数据集上,所提方法在不增加额外预测框的情况下,相比原YOLO v2检测算法的平均精度提高了约8个百分点。
引用
收藏
页码:91 / 96
页数:6
相关论文
共 17 条
  • [1] 无人机遥感系统的研究进展与应用前景
    李德仁
    李明
    [J]. 武汉大学学报(信息科学版) , 2014, (05) : 505 - 513+540
  • [2] Distinctive image features from scale-invariant keypoints
    Lowe, DG
    [J]. INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) : 91 - 110
  • [3] SUPPORT-VECTOR NETWORKS
    CORTES, C
    VAPNIK, V
    [J]. MACHINE LEARNING, 1995, 20 (03) : 273 - 297
  • [4] Object Detection with Discriminatively Trained Part-Based Models. Pedro F. Felzenszwalb,Ross B. Girshick,David McAllester,Deva Ramanan. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2010
  • [5] Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. Ojala, T.,Pietikainen, M.,Maenpaa, T. Pattern Analysis and Machine Intelligence, IEEE Transactions on . 2002
  • [6] Histograms of oriented gradients for humandetection. Dalai N,Triggs B. Proceedings of IEEE International Conference onComputer Vision and Pattern Recognition . 2005
  • [7] Rich feature hierarchies for accurate object detection and semantic segmentation. Girshick R,Donahue J,Darrell T, et al. Proceedings of the IEEE conference on computer vision and pattern recognition . 2014
  • [8] Faster R-CNN:towards real-time object detection with region proposal networks. Ren S,He K,Girshick R,et al. International Conference on Neural Information Processing Systems . 2015
  • [9] R-FCN:object detection via regionbased fully convolutional networks. DAI J,LI Y,HE Ket al. Proceedings of the 30th International Conference on Neural Information Processing Systems . 2016
  • [10] SSD:Single Shot MultiBox Detector. Liu W,Anguelov D,Erhan D,et al. European Conference on Computer Vision . 2016