应用于不平衡多分类问题的损失平衡函数

被引:31
作者
黄庆康
宋恺涛
陆建峰
机构
[1] 南京理工大学计算机科学与工程学院
关键词
不平衡学习; 不平衡数据分类; 多分类不平衡; 损失平衡; 不平衡数据分类算法; 不平衡数据集; F1调和平均; 卷积神经网络; 深度学习;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。
引用
收藏
页码:953 / 958
页数:6
相关论文
共 4 条
[1]
Recent advances in convolutional neural networks.[J].Jiuxiang Gu;Zhenhua Wang;Jason Kuen;Lianyang Ma;Amir Shahroudy;Bing Shuai;Ting Liu;Xingxing Wang;Gang Wang;Jianfei Cai;Tsuhan Chen.Pattern Recognition.2018,
[2]
A method for resampling imbalanced datasets in binary classification tasks for real-world problems.[J].Silvia Cateni;Valentina Colla;Marco Vannucci.Neurocomputing.2014,
[3]
Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories.[J].Li Fei-Fei;Rob Fergus;Pietro Perona.Computer Vision and Image Understanding.2006, 1
[4]
A study of the behavior of several methods for balancing machine learning training data.[J].Gustavo E. A. P. A. Batista;Ronaldo C. Prati;Maria Carolina Monard.ACM SIGKDD Explorations Newsletter.2004, 1