基于采样策略的主动学习算法研究进展

被引:33
作者
吴伟宁
刘扬
郭茂祖
刘晓燕
机构
[1] 哈尔滨工业大学计算机科学与技术学院
基金
中国博士后科学基金;
关键词
机器学习; 主动学习; 采样策略; 标记代价; 样例选择;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
主动学习算法通过选择信息含量大的未标记样例交由专家进行标记,多次循环使分类器的正确率逐步提高,进而在标记总代价最小的情况下获得分类器的强泛化能力,这一技术引起了国内外研究人员的关注.侧重从采样策略的角度,详细介绍了主动学习中学习引擎和采样引擎的工作过程,总结了主动学习算法的理论研究成果,详细评述了主动学习的研究现状和发展动态.首先,针对采样策略选择样例的不同方式将主动学习算法划分为不同类型,进而,对基于不同采样策略的主动学习算法进行了深入地分析和比较,讨论了各种算法适用的应用领域及其优缺点.最后指出了存在的开放性问题和进一步的研究方向.
引用
收藏
页码:1162 / 1173
页数:12
相关论文
共 14 条
[1]   选取最大可能预测错误样例的主动学习算法 [J].
龙军 ;
殷建平 ;
祝恩 ;
蔡志平 .
计算机研究与发展, 2008, (03) :472-478
[2]   主动贝叶斯网络分类器 [J].
宫秀军 ;
孙建平 ;
史忠植 .
计算机研究与发展, 2002, (05) :574-579
[3]   RATES OF CONVERGENCE IN ACTIVE LEARNING [J].
Hanneke, Steve .
ANNALS OF STATISTICS, 2011, 39 (01) :333-361
[4]   Learning More About Active Learning [J].
Stemp-Morlock, Graeme .
COMMUNICATIONS OF THE ACM, 2009, 52 (04) :11-13
[5]  
Selective Sampling Using the Query by Committee Algorithm[J] . Yoav Freund,H. Sebastian Seung,Eli Shamir,Naftali Tishby.Machine Learning . 1997 (2)
[6]   A decision-theoretic generalization of on-line learning and an application to boosting [J].
Freund, Y ;
Schapire, RE .
JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 1997, 55 (01) :119-139
[7]   Bagging predictors [J].
Breiman, L .
MACHINE LEARNING, 1996, 24 (02) :123-140
[8]   IMPROVING GENERALIZATION WITH ACTIVE LEARNING [J].
COHN, D ;
ATLAS, L ;
LADNER, R .
MACHINE LEARNING, 1994, 15 (02) :201-221
[9]   NEURAL NETWORKS AND THE BIAS VARIANCE DILEMMA [J].
GEMAN, S ;
BIENENSTOCK, E ;
DOURSAT, R .
NEURAL COMPUTATION, 1992, 4 (01) :1-58
[10]  
Queries and concept learning[J] . Dana Angluin.Machine Learning . 1988 (4)