基于编解码卷积神经网络的单张图像深度估计

被引:22
作者
贾瑞明
刘立强
刘圣杰
崔家礼
机构
[1] 北方工业大学信息学院
关键词
CNN; 编码器-解码器; 深度估计; 单目视觉;
D O I
暂无
中图分类号
TP391.41 []; TP183 [人工神经网络与计算];
学科分类号
140502 [人工智能];
摘要
针对传统方法在单目视觉图像深度估计时存在鲁棒性差、精度低等问题,提出一种基于卷积神经网络(CNN)的单张图像深度估计方法。首先,提出层级融合编码器-解码器网络,该网络是对端到端的编码器-解码器网络结构的一种改进。编码器端引入层级融合模块,并通过对多层级特征进行融合,提升网络对多尺度信息的利用率。其次,提出多感受野残差模块,其作为解码器的主要组成部分,负责从高级语义信息中估计深度信息。同时,多感受野残差模块可灵活地调整网络感受野大小,提高网络对多尺度特征的提取能力。在NYUDv2数据集上完成网络模型有效性验证。实验结果表明,与多尺度卷积神经网络相比,该方法在精度δ<1.25上提高约4.4%,在平均相对误差指标上降低约8.2%。证明其在单张图像深度估计的可行性。
引用
收藏
页码:718 / 724
页数:7
相关论文
共 4 条
[1]
智能驾驶中点云目标快速检测与跟踪 [J].
叶语同 ;
李必军 ;
付黎明 .
武汉大学学报(信息科学版) , 2019, (01) :139-144+152
[2]
基于深度卷积神经网络的道路场景深度估计 [J].
袁建中 ;
周武杰 ;
潘婷 ;
顾鹏笠 .
激光与光电子学进展, 2019, (08) :179-187
[3]
基于多孔卷积神经网络的图像深度估计模型 [J].
廖斌 ;
李浩文 .
计算机应用, 2019, 39 (01) :267-274
[4]
常用三维重建技术研究 [J].
刘源 ;
陈杰 ;
龚国成 ;
杨朝智 .
电子技术与软件工程, 2018, (11) :86-88