随机森林模型在分类与回归分析中的应用

被引:357
作者
李欣海
机构
[1] 中国科学院动物研究所
关键词
随机森林; 分类树; 判别分析; 回归; 机器学习;
D O I
暂无
中图分类号
S711 [森林数学];
学科分类号
摘要
随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异。随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不用做变量选择。现有的随机森林软件包给出了所有变量的重要性。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用(interaction)。它对离群值也不敏感。本文通过3个案例,分别介绍了随机森林在昆虫种类的判别分析、有无数据的分析(取代逻辑斯蒂回归)和回归分析上的应用。案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考。
引用
收藏
页码:1190 / 1197
页数:8
相关论文
共 11 条
[1]   用组合模型综合比较的方法分析气候变化对朱鹮潜在生境的影响 [J].
翟天庆 ;
李欣海 .
生态学报, 2012, 32 (08) :2361-2370
[2]   Vulnerability of 208 endemic or endangered species in China to the effects of climate change [J].
Li, Xinhai ;
Tian, Huidong ;
Wang, Yuan ;
Li, Renqiang ;
Song, Zengming ;
Zhang, Fengchun ;
Xu, Ming ;
Li, Dianmo .
REGIONAL ENVIRONMENTAL CHANGE, 2013, 13 (04) :843-852
[3]  
Classification in conservation biology: A comparison of five machine-learning methods[J] . Christian Kampichler,Ralf Wieland,Sophie Calmé,Holger Weissenberger,Stefan Arriaga-Weiss.Ecological Informatics . 2010 (6)
[4]   Variable selection using random forests [J].
Genuer, Robin ;
Poggi, Jean-Michel ;
Tuleau-Malot, Christine .
PATTERN RECOGNITION LETTERS, 2010, 31 (14) :2225-2236
[5]  
Variable Importance Assessment in Regression: Linear Regression versus Random Forest[J] . Ulrike Gr?mping.The American Statistician . 2009 (4)
[6]   Why the crested ibis declined in the middle twentieth century [J].
Li, Xinhai ;
Tian, Huidong ;
Li, Dianmo .
BIODIVERSITY AND CONSERVATION, 2009, 18 (08) :2165-2172
[7]  
Estimating potential habitat for 134 eastern US tree species under six climate scenarios[J] . Louis R. Iverson,Anantha M. Prasad,Stephen N. Matthews,Matthew Peters.Forest Ecology and Management . 2007 (3)
[8]  
Empirical characterization of random forest variable importance measures[J] . Kellie J. Archer,Ryan V. Kimes.Computational Statistics and Data Analysis . 2007 (4)
[9]  
Nest site use by crested ibis: dependence of a multifactor model on spatial scale[J] . Xinhai Li,Dianmo Li,Zhijun Ma,David C. Schneider.Landscape Ecology . 2006 (8)
[10]   Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32