基于编解码卷积神经网络的单张图像深度估计

被引：22

作者：

贾瑞明

刘立强

刘圣杰

崔家礼

机构：

[1] 北方工业大学信息学院

来源：

图学学报 | 2019年 / 40卷 / 04期

关键词：

CNN; 编码器-解码器; 深度估计; 单目视觉;

D O I：

暂无

中图分类号：

TP391.41 []; TP183 [人工神经网络与计算];

学科分类号：

140502 [人工智能];

摘要：

针对传统方法在单目视觉图像深度估计时存在鲁棒性差、精度低等问题,提出一种基于卷积神经网络(CNN)的单张图像深度估计方法。首先,提出层级融合编码器-解码器网络,该网络是对端到端的编码器-解码器网络结构的一种改进。编码器端引入层级融合模块,并通过对多层级特征进行融合,提升网络对多尺度信息的利用率。其次,提出多感受野残差模块,其作为解码器的主要组成部分,负责从高级语义信息中估计深度信息。同时,多感受野残差模块可灵活地调整网络感受野大小,提高网络对多尺度特征的提取能力。在NYUDv2数据集上完成网络模型有效性验证。实验结果表明,与多尺度卷积神经网络相比,该方法在精度δ<1.25上提高约4.4%,在平均相对误差指标上降低约8.2%。证明其在单张图像深度估计的可行性。

引用

页码：718 / 724

页数：7

共 4 条

[1]

智能驾驶中点云目标快速检测与跟踪 [J].