基于随机森林的正例与未标注学习

被引:12
作者
邵强
张阳
蔡晓妍
机构
[1] 西北农林科技大学信息工程学院
关键词
正例与未标注学习; 决策树; 随机森林; 集成学习; 偏置支持向量机;
D O I
10.16208/j.issn1000-7024.2014.12.065
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
为使用正例与未标注数据训练分类器(positive and unlabeled learning,PU learning),提出基于随机森林的PU学习算法。对POSC4.5算法进行扩展,在其生成决策树的过程中加入随机特征选择;在训练阶段,使用有放回抽样技术对PU数据集抽样,生成多个不同的PU训练集,并以其训练扩展后的POSC4.5算法,构造多棵决策树;在分类阶段,采用多数投票策略集成各决策树输出。在UCI数据集上的实验结果表明,该算法的分类性能优于偏置支持向量机算法、POS4.5算法和基于装袋技术的POSC4.5算法。
引用
收藏
页码:4329 / 4334
页数:6
相关论文
共 2 条
[1]
Learning from data streams with only positive and unlabeled data [J].
Qin, Xiangju ;
Zhang, Yang ;
Li, Chen ;
Li, Xue .
JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 2013, 40 (03) :405-430
[2]
LIBSVM.[J].Chih-Chung Chang;Chih-Jen Lin.ACM Transactions on Intelligent Systems and Technology (TIST).2011, 3