一种顺序响应的随机森林:变量预测和选择

被引:10
作者
吴辰文
梁靖涵
王伟
李长生
机构
[1] 兰州交通大学电子与信息工程学院
关键词
随机森林(RF); 有序回归树; 顺序响应; 特征选择; 变量重要性;
D O I
10.20009/j.cnki.21-1106/tp.2017.08.019
中图分类号
O212 [数理统计];
学科分类号
070103 [概率论与数理统计];
摘要
利用随机森林法(RF)进行分类和回归,在过去被广泛地研究,然而在基于顺序响应的情况下并没有标准的方法.在随机森林(RF)的基础上通过广泛的研究,对条件推理树进行探索,以探讨结合顺序信息是否改善预测性能或提高变量选择的效果.本文提出的两种置换变量的重要性预测方法 RPS-VIM和MAE-VIM经过实验验证是优化的方法,它替代目前存在的内置变量重要性测量方法 ER-VIM和MSE-VIM.基于真实数据的结果表明在某些设置中,有序回归树中使用RPS-VIM和MAEVIM顺序响应的组合,预测的排名可以得到改善,并且预测精度优于原始的基于分类树的随机森林.
引用
收藏
页码:1762 / 1766
页数:5
相关论文
共 8 条
[1]
基于排序熵的有序决策树高效算法研究 [D]. 
陈建凯 .
河北大学,
2014
[2]
多分类有序变量间距差异的统计分析与实际应用 [D]. 
陈民恳 .
厦门大学,
2007
[3]
基于异构代价敏感决策树的分类器算法 [J].
阮晓宏 ;
黄小猛 ;
袁鼎荣 ;
段巧灵 .
计算机科学, 2013, 40(S2) (S2) :140-142+146
[4]
随机森林方法研究综述 [J].
方匡南 ;
吴见彬 ;
朱建平 ;
谢邦昌 .
统计与信息论坛, 2011, 26 (03) :32-38
[5]
Overview of random forest methodology and practical guidance with emphasis on computational biology and bioinformatics [J].
Boulesteix, Anne-Laure ;
Janitza, Silke ;
Kruppa, Jochen ;
Koenig, Inke R. .
WILEY INTERDISCIPLINARY REVIEWS-DATA MINING AND KNOWLEDGE DISCOVERY, 2012, 2 (06) :493-507
[6]
Random forest Gini importance favours SNPs with large minor allele frequency: impact, sources and recommendations [J].
Boulesteix, Anne-Laure ;
Bender, Andreas ;
Bermejo, Justo Lorenzo ;
Strobl, Carolin .
BRIEFINGS IN BIOINFORMATICS, 2012, 13 (03) :292-304
[7]
Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32
[8]
A new measure of nominal-ordinal association [J].
Piccarreta, R .
JOURNAL OF APPLIED STATISTICS, 2001, 28 (01) :107-120