基于多视角融合的细粒度图像分类方法

被引：5

作者：

黄伟锋 ^{[1
]}

张甜 ^{[2
]}

常东良 ^{[2
]}

闫冬 ^{[3
]}

王嘉希 ^{[1
]}

王丹 ^{[1
]}

马占宇 ^{[2
]}

机构：

[1] 南水北调中线信息科技有限公司

[2] 北京邮电大学人工智能学院

[3] 北京邮电大学图书馆

来源：

信号处理 | 2020年 / 36卷 / 09期

基金：

国家重点研发计划;

关键词：

细粒度图像分类; 度量学习; 卷积神经网络; 注意力机制;

D O I：

10.16798/j.issn.1003-0530.2020.09.027

中图分类号：

TP391.41 [];

学科分类号：

080203 ;

摘要：

细粒度图像分类的目标是区分同一个常见类下的不同子类,由于数据集往往存在较大的类内差异和较大的类间相似性,细粒度图像分类相比于传统图像分类具有更大的挑战性。以往工作中,基于组件的方法和基于注意力的方法致力于挖掘图像中的显著性区域,而忽视了用来区分易混淆类别的微弱差异。为了解决以上问题,本文提出了一个基于多视角融合的细粒度图像分类方法,包含两个分支,其中一个分支基于特征图挖掘图像的细粒度特征,另一个分支则学习图像的全局特征。同时引入一种嵌入损失,与传统多分类交叉熵损失函数结合增强特征的判别性,进而提升模型的分类性能。所提方法仅使用图像级标签,在CUB-200-2011,Stanford Cars和FGVC Aircraft这三个基准数据集上的分类准确率分别达到了88.3%,94.3%和92.4%,实验结果表明所提方法相比其他细粒度图像分类方法具有一定的优越性。

引用

页码：1607 / 1614

页数：8

共 5 条

[1] 基于多分支神经网络模型的弱监督细粒度图像分类方法 [J].