基于随机森林和转导推理的特征提取方法

被引:7
作者
邱一卉
米红
机构
[1] 厦门大学信息科学与技术学院
关键词
特征提取; 随机森林; 转导推理;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
提出一种基于随机森林和转导推理的特征提取方法,步骤如下:1)利用带标签的训练样本建立随机森林模型;2)将无标签的测试数据导入随机森林模型中,生成全体数据(训练样本和测试数据)的相似性矩阵;3)对该相似性矩阵进行多维尺度变换得到全体数据的低维数据表示,即低维特征,使得原高维数据在低维空间中具有更好的可分性.UCI数据库的实验结果表明:与主成分分析方法相比,该方法将无标签测试集的数据分布信息转移到相似性矩阵中,更好地刻画整个样本空间上的数据分布特性,从而提高分类器的性能,是一种行之有效的特征提取方法.最后还讨论了特征提取维数对模型准确率的影响,为实际应用提供参考.
引用
收藏
页码:333 / 338
页数:6
相关论文
共 6 条
[1]   基于直推式方法的网络异常检测方法 [J].
李洋 ;
方滨兴 ;
郭莉 ;
陈友 .
软件学报, 2007, (10) :2595-2604
[2]   算法随机性置信支持向量机及其签名认证 [J].
邱德红 ;
陈传波 ;
金先级 .
小型微型计算机系统, 2004, (12) :2131-2134
[3]   基于支持向量机的渐进直推式分类学习算法 [J].
陈毅松 ;
汪国平 ;
董士海 .
软件学报, 2003, (03) :451-460
[4]  
统计模式识别[M]. 电子工业出版社 , (英)AndrewR.Webb著, 2004
[5]  
统计学习理论[M]. 电子工业出版社 , (美)瓦普尼克(VladimirN.Vapnik)著, 2004
[6]   Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32