面向非平衡训练集分类的随机森林算法优化

被引:70
作者
吴琼
李运田
郑献卫
机构
[1] 上海大学机电工程与自动化学院
关键词
数据挖掘; 非平衡训练集; 随机森林; NCL;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
数据挖掘是当今社会最活跃的研究方向之一,迄今为止数据挖掘技术已经广泛应用到各行各业中,然而在数据挖掘过程中往往会遇到很多非平衡训练集,采用传统的数据挖掘技术对非平衡训练集集进行处理不能得到理想的效果。主要是针对非平衡训练集,对数据进行NCL(Neighborhood Cleaning Rule)技术处理并结合随机森林(Random Forest)算法进行分类,试验结果表明,改进后的随机森林算法分类效果更好。
引用
收藏
页码:89 / 90
页数:2
相关论文
共 5 条
[1]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[2]
基于R语言的面向需水预测的随机森林方法 [J].
明均仁 ;
肖凯 .
统计与决策, 2012, (09) :81-83
[3]
基于随机森林的建筑结构损伤识别方法 [J].
周绮凤 ;
杨小青 ;
周青青 ;
雷家艳 .
振动测试与诊断., 2012, 32 (02) :197-201+338
[4]
不平衡数据分类的混合算法 [J].
韩敏 ;
朱新荣 .
控制理论与应用, 2011, 28 (10) :1485-1489
[5]
处理非平衡数据的粒度SVM学习算法 [J].
郭虎升 ;
亓慧 ;
王文剑 .
计算机工程, 2010, 36 (02) :181-183