随机森林针对小样本数据类权重设置

被引：68

作者：

李建更

高志坤

机构：

[1] 北京工业大学人工智能与机器人研究所

来源：

计算机工程与应用 | 2009年 / 26期

基金：

北京市自然科学基金;

关键词：

随机森林; 类权重; 小样本; 支持向量机; 特征选择;

D O I：

暂无

中图分类号：

TP391.41 [];

学科分类号：

摘要：

随机森林已经被证明是一种高效的分类与特征选择方法。尽管参数的设置对结果影响较小,但合适的参数可以使分类器得到理想的效果。主要针对癌症研究中小样本不均衡数据的分类和特征选择问题,研究了随机森林中类权重的设置。为了比较在不同的类权重下特征选择的效果,同时使用支持向量机(Support Vector Machine,SVM)方法。最终结果显示最优的类权重是不确定的。最后总结出几条规律指导研究者选择合适的权重使分类和特征选择效果得到改善。

引用

页码：131 / 134

页数：4