多标签代价敏感分类集成学习算法

被引:65
作者
付忠良
机构
[1] 中国科学院成都计算机应用研究所
关键词
多标签分类; 代价敏感学习; 集成学习; 自适应提升算法; 多分类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
尽管多标签分类问题可以转换成一般多分类问题解决,但多标签代价敏感分类问题却很难转换成多类代价敏感分类问题.通过对多分类代价敏感学习算法扩展为多标签代价敏感学习算法时遇到的一些问题进行分析,提出了一种多标签代价敏感分类集成学习算法.算法的平均错分代价为误检标签代价和漏检标签代价之和,算法的流程类似于自适应提升(Adaptive boosting,AdaBoost)算法,其可以自动学习多个弱分类器来组合成强分类器,强分类器的平均错分代价将随着弱分类器增加而逐渐降低.详细分析了多标签代价敏感分类集成学习算法和多类代价敏感AdaBoost算法的区别,包括输出标签的依据和错分代价的含义.不同于通常的多类代价敏感分类问题,多标签代价敏感分类问题的错分代价要受到一定的限制,详细分析并给出了具体的限制条件.简化该算法得到了一种多标签AdaBoost算法和一种多类代价敏感AdaBoost算法.理论分析和实验结果均表明提出的多标签代价敏感分类集成学习算法是有效的,该算法能实现平均错分代价的最小化.特别地,对于不同类错分代价相差较大的多分类问题,该算法的效果明显好于已有的多类代价敏感AdaBoost算法.
引用
收藏
页码:1075 / 1085
页数:11
相关论文
共 11 条
[1]
Multi-instance multi-label learning.[J].Zhi-Hua Zhou;Min-Ling Zhang;Sheng-Jun Huang;Yu-Feng Li.Artificial Intelligence.2011, 1
[2]
Multi-Label Classification: An Overview.[J].Grigorios Tsoumakas;Ioannis Katakis.International Journal of Data Warehousing and Mining (IJDWM).2007, 3
[3]
M L-KNN : A lazy learning approach to multi-label learning.[J].Min-Ling Zhang;Zhi-Hua Zhou.Pattern Recognition.2007, 7
[4]
Learning multi-label scene classification [J].
Boutell, MR ;
Luo, JB ;
Shen, XP ;
Brown, CM .
PATTERN RECOGNITION, 2004, 37 (09) :1757-1771
[5]
Improved boosting algorithms using confidence-rated predictions [J].
Schapire, RE ;
Singer, Y .
MACHINE LEARNING, 1999, 37 (03) :297-336
[6]
通用集成学习算法的构造 [J].
付忠良 .
计算机研究与发展, 2013, 50 (04) :861-872
[7]
AdaBoost算法研究进展与展望 [J].
曹莹 ;
苗启广 ;
刘家辰 ;
高琳 .
自动化学报, 2013, 39 (06) :745-758
[8]
一种用于方向预测的集成学习算法 [J].
付忠良 .
上海交通大学学报, 2012, 46 (02) :250-258
[9]
多分类问题代价敏感AdaBoost算法 [J].
付忠良 .
自动化学报, 2011, 37 (08) :973-983
[10]
基于LS-SVM的多标签分类算法 [J].
殷会 ;
许建华 ;
许花 .
南京师范大学学报(工程技术版), 2010, 10 (02) :68-73