多分类问题代价敏感AdaBoost算法

被引:30
作者
付忠良
机构
[1] 中国科学院成都计算机应用研究所
基金
国家高技术研究发展计划(863计划);
关键词
代价敏感学习; 多分类问题; 多标签分类问题; 连续AdaBoost; 代价敏感分类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对目前多分类代价敏感分类问题在转换成二分类代价敏感分类问题存在的代价合并问题,研究并构造出了可直接应用于多分类问题的代价敏感AdaBoost算法.算法具有与连续AdaBoost算法类似的流程和误差估计.当代价完全相等时,该算法就变成了一种新的多分类的连续AdaBoost算法,算法能够确保训练错误率随着训练的分类器的个数增加而降低,但不直接要求各个分类器相互独立条件,或者说独立性条件可以通过算法规则来保证,但现有多分类连续AdaBoost算法的推导必须要求各个分类器相互独立.实验数据表明,算法可以真正实现分类结果偏向错分代价较小的类,特别当每一类被错分成其他类的代价不平衡但平均代价相等时,目前已有的多分类代价敏感学习算法会失效,但新方法仍然能实现最小的错分代价.研究方法为进一步研究集成学习算法提供了一种新的思路,得到了一种易操作并近似满足分类错误率最小的多标签分类问题的AdaBoost算法.
引用
收藏
页码:973 / 983
页数:11
相关论文
共 12 条
[1]   分类器动态组合及基于分类器组合的集成学习算法 [J].
付忠良 ;
赵向辉 .
四川大学学报(工程科学版), 2011, 43 (02) :58-65
[2]  
基于多维金字塔表达和AdaBoost的高分辨率SAR图像城区场景分类算法[J]. 殷慧,曹永锋,孙洪.自动化学报. 2010(08)
[3]  
非对称AdaBaost算法及其在目标检测中的应用(英文)[J]. 葛俊锋,罗予频.自动化学报. 2009(11)
[4]   分类器线性组合的有效性和最佳组合问题的研究 [J].
付忠良 .
计算机研究与发展, 2009, 46 (07) :1206-1216
[5]   不平衡分类问题研究综述 [J].
叶志飞 ;
文益民 ;
吕宝粮 .
智能系统学报, 2009, 4 (02) :148-156
[6]   关于AdaBoost有效性的分析 [J].
付忠良 .
计算机研究与发展, 2008, (10) :1747-1755
[7]   代价敏感分类器的比较研究(英文) [J].
凌晓峰 ;
SHENG Victor S. .
计算机学报, 2007, (08) :1203-1211
[8]   Multi-class AdaBoost [J].
Zhu, Ji ;
Zou, Hui ;
Rosset, Saharon ;
Hastie, Trevor .
STATISTICS AND ITS INTERFACE, 2009, 2 (03) :349-360
[9]  
M L-KNN : A lazy learning approach to multi-label learning[J] . Min-Ling Zhang,Zhi-Hua Zhou.Pattern Recognition . 2007 (7)
[10]   Learning multi-label scene classification [J].
Boutell, MR ;
Luo, JB ;
Shen, XP ;
Brown, CM .
PATTERN RECOGNITION, 2004, 37 (09) :1757-1771