随机森林针对小样本数据类权重设置

被引:68
作者
李建更
高志坤
机构
[1] 北京工业大学人工智能与机器人研究所
基金
北京市自然科学基金;
关键词
随机森林; 类权重; 小样本; 支持向量机; 特征选择;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
随机森林已经被证明是一种高效的分类与特征选择方法。尽管参数的设置对结果影响较小,但合适的参数可以使分类器得到理想的效果。主要针对癌症研究中小样本不均衡数据的分类和特征选择问题,研究了随机森林中类权重的设置。为了比较在不同的类权重下特征选择的效果,同时使用支持向量机(Support Vector Machine,SVM)方法。最终结果显示最优的类权重是不确定的。最后总结出几条规律指导研究者选择合适的权重使分类和特征选择效果得到改善。
引用
收藏
页码:131 / 134
页数:4
相关论文
共 2 条
[1]
训练集类别分布对文本分类的影响[J] 张启蕊;张凌;董守斌;谭景华 清华大学学报(自然科学版) 2005, S1
[2]
Random Forests.[J] Leo Breiman Machine Learning 2001,