高维小样本分类问题中特征选择研究综述

被引:108
作者
王翔 [1 ,2 ]
胡学钢 [1 ]
机构
[1] 合肥工业大学计算机信息学院
[2] 安徽省科学技术情报研究所文献情报分析中心
基金
安徽省自然科学基金;
关键词
特征选择; 高维数据; 小样本学习; 信息过滤; 支持向量机;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
随着生物信息学、基因表达谱微阵列、图像识别等技术的发展,高维小样本分类问题成为数据挖掘(包括机器学习、模式识别)中的一项挑战性任务,容易引发"维数灾难"和过拟合问题。针对这个问题,特征选择可以有效避免维数灾难,提升分类模型泛化能力,成为研究的热点,有必要对国内外高维小样本特征选择主要研究情况进行综述。首先分析了高维小样本特征选择问题的本质;其次,根据其算法的本质区别,重点对高维小样本数据的特征选择方法进行分类剖析和比较;最后对高维小样本特征选择研究面临的挑战以及研究方向作了展望。
引用
收藏
页码:2433 / 2438+2448 +2448
页数:7
相关论文
共 30 条
[1]
基因表达谱数据挖掘的特征提取方法研究 [D]. 
姚唐龙 .
安徽大学,
2015
[2]
面向高维小样本数据的分类特征选择算法研究 [D]. 
张靖 .
合肥工业大学,
2014
[3]
Feature selection using multimodal optimization techniques.[J].Shima Kamyab;Mahdi Eftekhari.Neurocomputing.2016,
[4]
A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data.[J].Zena M. Hira;Duncan F. Gillies;Huixiao Hong.Advances in Bioinformatics.2015,
[5]
A Projection Pursuit framework for supervised dimension reduction of high dimensional small sample datasets.[J].Soledad Espezua;Edwin Villanueva;Carlos D. Maciel;André Carvalho.Neurocomputing.2015,
[6]
Sequential Lasso Cum EBIC for Feature Selection With Ultra-High Dimensional Feature Space [J].
Luo, Shan ;
Chen, Zehua .
JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 2014, 109 (507) :1229-1240
[7]
A review of microarray datasets and applied feature selection methods.[J].V. Bolón-Canedo;N. Sánchez-Maroño;A. Alonso-Betanzos;J.M. Benítez;F. Herrera.Information Sciences.2014,
[8]
A survey on feature selection methods [J].
Chandrashekar, Girish ;
Sahin, Ferat .
COMPUTERS & ELECTRICAL ENGINEERING, 2014, 40 (01) :16-28
[9]
Fast wrapper feature subset selection in high-dimensional datasets by means of filter re-ranking.[J].Pablo Bermejo;Luis de la Ossa;José A. Gámez;José M. Puerta.Knowledge-Based Systems.2011, 1
[10]
An improvement on floating search algorithms for feature subset selection.[J].Songyot Nakariyakul;David P. Casasent.Pattern Recognition.2008, 9