随机森林理论浅析

被引:146
作者
董师师 [1 ,2 ]
黄哲学 [1 ,2 ]
机构
[1] 深圳市高性能数据挖掘重点实验室
[2] 中国科学院深圳先进技术研究院
关键词
随机森林; 数据挖掘; 机器学习;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随机森林是一种著名的集成学习方法,被广泛应用于数据分类和非参数回归。本文对随机森林算法的主要理论进行阐述,包括随机森林收敛定理、泛化误差界以和袋外估计三个部分。最后介绍一种属性加权子空间抽样的随机森林改进算法,用于解决超高维数据的分类问题。
引用
收藏
页码:1 / 7
页数:7
相关论文
共 9 条
  • [1] 基于随机森林方法的基金收益率方向预测与交易策略研究
    方匡南
    朱建平
    谢邦昌
    [J]. 经济经纬, 2010, (02) : 61 - 65
  • [2] 基于随机森林的文本分类模型研究
    张华伟
    王明文
    甘丽新
    [J]. 山东大学学报(理学版), 2006, (03) : 139 - 143
  • [3] 模式分类[M]. 机械工业出版社 , (美)RichardO.Duda等著, 2003
  • [4] 数据挖掘[M]. 机械工业出版社 , (加)JiaweiHan,(加)MichelineKamber著, 2001
  • [5] Random forests
    Breiman, L
    [J]. MACHINE LEARNING, 2001, 45 (01) : 5 - 32
  • [6] SUPPORT-VECTOR NETWORKS
    CORTES, C
    VAPNIK, V
    [J]. MACHINE LEARNING, 1995, 20 (03) : 273 - 297
  • [7] Bagging predictors
    Breiman, L
    [J]. MACHINE LEARNING, 1996, 24 (02) : 123 - 140
  • [8] Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)
  • [9] Preventing customer churn by using random forests modeling. YING Wei-yun,LI Xiu,XIE Ya-ya,et al. Proc of IEEE International Conference on Information Reuse and Integration . 2008