主动学习中一种基于委员会的误分类采样算法

被引:11
作者
龙军
殷建平
祝恩
赵文涛
机构
[1] 国防科技大学计算机学院
基金
湖南省自然科学基金;
关键词
主动学习; 误分类采样; 版本空间缩减;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
主动学习通过主动选择要学习的样例进行标注,从而有效地降低学习算法的样本复杂度。针对当前主动学习算法普遍采用的平分版本空间策略,本文提出过半缩减版本空间的策略,这种策略避免了平分版本空间策略所要求的较强假设。基于过半缩减版本空间的策略,本文实现了一种选取具有最大可能性被误分类的样例作为训练样例的启发式主动学习算法(CBMPMS)。该算法计算版本空间中随机抽取的假设组成的委员会和当前学习器对样例预测的类概率差异的熵,以此作为选择样例的标准。针对UCI数据集的实验表明,该算法能够在大多数数据集上取得比相关研究更好的性能。
引用
收藏
页码:69 / 72+117 +117
页数:5
相关论文
共 4 条
[1]
IMPROVING GENERALIZATION WITH ACTIVE LEARNING [J].
COHN, D ;
ATLAS, L ;
LADNER, R .
MACHINE LEARNING, 1994, 15 (02) :201-221
[2]
THE STRENGTH OF WEAK LEARNABILITY [J].
SCHAPIRE, RE .
MACHINE LEARNING, 1990, 5 (02) :197-227
[3]
Selective sampling using the query by committee algorithm [J].
Freund, Y ;
Seung, HS ;
Shamir, E ;
Tishby, N .
MACHINE LEARNING, 1997, 28 (2-3) :133-168
[4]
Query by committee..H. S. Seung; M. Opper and H. Sompolinsky;.In: PA Pittsburgh; eds. Proceedings 5th Annual Workshop on Computational Learning Theory.1992,