拟自适应分类随机森林算法

被引:17
作者
马景义 [1 ]
吴喜之 [2 ]
谢邦昌 [1 ,3 ]
机构
[1] 中央财经大学统计学院
[2] 中国人民大学统计学院
[3] 台湾辅仁大学统计资讯学系
关键词
集成学习; 拟自适应; 随机森林;
D O I
10.13860/j.cnki.sltj.2010.05.002
中图分类号
O211.6 [随机过程];
学科分类号
摘要
本文给出了集成学习模型可以收敛的集成学习算法,拟自适应分类随机森林算法。拟自适应分类随机森林算法综合了Adaboost算法和随机森林算法的优势,实验数据分析表明,训练集较大时,拟自适应随机森林算法的效果会好于随机森林算法。另外,拟自适应分类随机森林算法的收敛性确保它的推广误差可以通过训练集估计,所以,对于实际数据,拟自适应分类随机森林算法不需要把数据划分为训练集和测试集,从而,可以有效的利用数据信息。
引用
收藏
页码:805 / 811
页数:7
相关论文
共 5 条
[1]  
A Data Complexity Analysis of Comparative Advantages of Decision Forest Constructors[J] . Tin Kam Ho.Pattern Analysis & Applications . 2002 (2)
[2]   Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32
[3]  
Boosting the Margin: A New Explanation for the Effectiveness of Voting Methods[J] . Robert E. Schapire,Yoav Freund,Peter Bartlett,Wee Sun Lee.The Annals of Statistics . 1998 (5)
[4]  
Arcing Classifiers[J] . Leo Breiman.The Annals of Statistics . 1998 (3)
[5]  
Random Decision Forest. Ho T K. Proceedings of the Third International Conference on Document Analysis and Recognition . 1995