基于多分支神经网络模型的弱监督细粒度图像分类方法

被引:6
作者
边小勇 [1 ,2 ,3 ]
江沛龄 [1 ,2 ,3 ]
赵敏 [4 ,5 ]
丁胜 [1 ,2 ,3 ]
张晓龙 [1 ,2 ,3 ]
机构
[1] 武汉科技大学计算机科学与技术学院
[2] 武汉科技大学大数据科学与工程研究院
[3] 智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学)
[4] 武汉科技大学信息科学与工程学院
[5] 冶金自动化与检测技术教育部工程研究中心(武汉科技大学)
关键词
细粒度图像分类; 深度学习; 弱监督; 可变形卷积; 类激活图; 方向响应网络;
D O I
暂无
中图分类号
TP391.41 []; TP183 [人工神经网络与计算];
学科分类号
080203 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络ResNet-50和旋转不变编码的方向响应网络(ORN);其次,利用预训练模型分别初始化特征网络,并输入原图和以上局部区域分别对模型进行微调;最后,组合三个分支内损失和分支间损失优化整个网络,对测试集进行分类预测。所提方法在CUB-200-2011和FGVCAircraft数据集上的分类准确率分别达到87. 7%和90. 8%,与多注意力卷积神经网络(MA-CNN)方法相比,分别提高了1. 2个百分点和0. 9个百分点;在Aircraft2数据集上的分类准确率达到91. 8%,比ResNet-50网络提高了4. 1个百分点。实验结果表明,所提方法有效提高了弱监督细粒度图像分类的准确率。
引用
收藏
页码:1295 / 1300
页数:6
相关论文
共 54 条
[1]  
The caltech-ucsd birds 200-2011 dataset. Wah C,Branson S,Welinder P,et al. . 2011
[2]  
The caltech-ucsd birds 200-2011 dataset. Wah C,Branson S,Welinder P,et al. . 2011
[3]  
IORN:an effective remote sensing image scene classification framework. WANG J,LIU W,MA L,et al. IEEE Geoscience and Remote Sensing Letters . 2018
[4]  
IORN:an effective remote sensing image scene classification framework. WANG J,LIU W,MA L,et al. IEEE Geoscience and Remote Sensing Letters . 2018
[5]   基于尺度注意力网络的遥感图像场景分类 [J].
边小勇 ;
费雄君 ;
穆楠 .
计算机应用, 2020, 40 (03) :872-877
[6]   基于尺度注意力网络的遥感图像场景分类 [J].
边小勇 ;
费雄君 ;
穆楠 .
计算机应用, 2020, 40 (03) :872-877
[7]   聚焦——识别网络架构的细粒度图像分类 [J].
王永雄 ;
张晓兵 .
中国图象图形学报, 2019, 24 (04) :493-502
[8]   聚焦——识别网络架构的细粒度图像分类 [J].
王永雄 ;
张晓兵 .
中国图象图形学报, 2019, 24 (04) :493-502
[9]   基于多通道视觉注意力的细粒度图像分类 [J].
王培森 ;
宋彦 ;
戴礼荣 .
数据采集与处理, 2019, 34 (01) :157-166
[10]   基于多通道视觉注意力的细粒度图像分类 [J].
王培森 ;
宋彦 ;
戴礼荣 .
数据采集与处理, 2019, 34 (01) :157-166