应用于不平衡多分类问题的损失平衡函数

被引：31

作者：

黄庆康

宋恺涛

陆建峰

机构：

[1] 南京理工大学计算机科学与工程学院

来源：

智能系统学报 | 2019年 / 14卷 / 05期

关键词：

不平衡学习; 不平衡数据分类; 多分类不平衡; 损失平衡; 不平衡数据分类算法; 不平衡数据集; F1调和平均; 卷积神经网络; 深度学习;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

140502 [人工智能];

摘要：

传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。

引用

页码：953 / 958

页数：6

共 4 条

[1]

Recent advances in convolutional neural networks.[J].Jiuxiang Gu;Zhenhua Wang;Jason Kuen;Lianyang Ma;Amir Shahroudy;Bing Shuai;Ting Liu;Xingxing Wang;Gang Wang;Jianfei Cai;Tsuhan Chen.Pattern Recognition.2018,

[2]

A method for resampling imbalanced datasets in binary classification tasks for real-world problems.[J].Silvia Cateni;Valentina Colla;Marco Vannucci.Neurocomputing.2014,

[3]

Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories.[J].Li Fei-Fei;Rob Fergus;Pietro Perona.Computer Vision and Image Understanding.2006, 1

[4]

A study of the behavior of several methods for balancing machine learning training data.[J].Gustavo E. A. P. A. Batista;Ronaldo C. Prati;Maria Carolina Monard.ACM SIGKDD Explorations Newsletter.2004, 1

← 1 →