利用卷积神经网络的自动驾驶场景语义分割

被引:32
作者
王中宇 [1 ]
倪显扬 [1 ]
尚振东 [2 ]
机构
[1] 北京航空航天大学仪器科学与光电工程学院
[2] 河南科技大学机电工程学院
基金
北京市自然科学基金;
关键词
自动驾驶; 图像语义分割; 卷积神经网络; DeepLab v3+;
D O I
暂无
中图分类号
TP391.41 []; TP183 [人工神经网络与计算]; U463.6 [电气设备及附件];
学科分类号
080203 ; 081104 ; 0812 ; 0835 ; 1405 ; 080204 ; 082304 ;
摘要
图像语义分割是现代自动驾驶系统的一个必要部分,因为对汽车周围场景的准确理解是导航和动作规划的关键。为提高自动驾驶场景的图像语义分割准确率,且考虑到当下流行的基于卷积神经网络的语义分割模型(DeepLab v3+)无法有效地利用注意力信息,导致分割边界粗糙等问题,提出一种融合底层像素信息与通道、空间信息的语义分割神经网络。在卷积神经网络中插入注意力模块,提取出图像语义级别的信息,通过学习图像的位置信息和通道信息得到更加丰富的特征;从卷积神经网络输出的各类别得分值计算出单点势能,且从初步分割图和原图得到成对势能,以便全连接条件随机场对图像的全部像素进行建模,并且优化图像的局部细节;全连接条件随机场通过迭代得到语义分割的最终结果。在CityScapes数据集上进行了测试,与DeepLab v3+相比较,改进后的模型分别提高了均交并比和均像素精度等关键指标1.07%和3.34%。它能够更加精细地分割目标,较好地解决分割边界粗糙,有效地抑制边界区域分割的过度平滑和不合理孤岛等问题。
引用
收藏
页码:2429 / 2438
页数:10
相关论文
共 4 条
[1]   多模深度卷积神经网络应用于视频表情识别 [J].
潘仙张 ;
张石清 ;
郭文平 .
光学精密工程, 2019, 27 (04) :963-970
[2]   基于改进深度卷积网络的铁路入侵行人分类算法 [J].
郭保青 ;
王宁 .
光学精密工程, 2018, 26 (12) :3040-3050
[3]   基于卷积神经网络的光学遥感图像检索 [J].
李宇 ;
刘雪莹 ;
张洪群 ;
李湘眷 ;
孙晓瑶 .
光学精密工程, 2018, 26 (01) :200-207
[4]   A Fast Approximation of the Bilateral Filter Using a Signal Processing Approach [J].
Paris, Sylvain ;
Durand, Fredo .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2009, 81 (01) :24-52