特征选择稳定性研究综述

被引:116
作者
刘艺 [1 ]
曹建军 [2 ]
刁兴春 [1 ]
周星 [1 ]
机构
[1] 解放军理工大学指挥信息系统学院
[2] 国防科技大学第研究所
基金
中国博士后科学基金;
关键词
高维数据; 特征选择; 稳定性; 稳定性指标; 集成选择; 演化算法;
D O I
暂无
中图分类号
TP311.13 []; TP181 [自动推理、机器学习];
学科分类号
140502 [人工智能];
摘要
随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动具有一定鲁棒性.提高特征选择稳定性有助于发现相关特征,增强特征可信度,进一步降低开销.在回顾现有特征选择稳定性提升方法的基础上对其进行分类,分析比较各类方法的特点和适用范围,总结特征选择稳定性中的相关评估工作,并通过实验剖析其中稳定性度量指标的性能,进而对比4种集成方法的效用.最后讨论当前工作的局限性,指出未来的研究方向.
引用
收藏
页码:2559 / 2579
页数:21
相关论文
共 34 条
[1]
基于近邻信息和PSO算法的集成特征选取 [J].
刘全金 ;
赵志敏 ;
李颖新 ;
俞晓磊 .
电子学报, 2016, 44 (04) :995-1002
[2]
高分辨率遥感影像典型地物目标的特征选择及其稳定性研究 [D]. 
季金胜 .
上海交通大学,
2015
[3]
高维小样本数据的特征选择研究及其稳定性分析 [D]. 
宁永鹏 .
厦门大学,
2014
[4]
Feature selection for high dimensional imbalanced class data using harmony search[J] Alireza Moayedikia;Kok-Leong Ong;Yee Ling Boo;William GS Yeoh;Richard Jensen Engineering Applications of Artificial Intelligence 2017,
[5]
Fast and Scalable Feature Selection for Gene Expression Data Using Hilbert-Schmidt Independence Criterion[J] Mehrdad J. Gangeh;Hadi Zarkoob;Ali Ghodsi IEEE/ACM Transactions on Computational Biology and Bioinformatics (TCBB) 2017,
[6]
Stability of feature selection in classification issues for high-dimensional correlated data[J] Émeline Perthame;Chloé Friguet;David Causeur Statistics and Computing 2016,
[7]
High-dimensional feature selection via feature grouping: A Variable Neighborhood Search approach[J] Miguel García-Torres;Francisco Gómez-Vela;Belén Melián-Batista;J. Marcos Moreno-Vega Information Sciences 2016,
[8]
A novel features ranking metric with application to scalable visual and bioinformatics data classification[J] Quan Zou;Jiancang Zeng;Liujuan Cao;Rongrong Ji Neurocomputing 2016,
[9]
Feature selection for high-dimensional data[J] Verónica Bolón-Canedo;Noelia Sánchez-Maroño;Amparo Alonso-Betanzos Progress in Artificial Intelligence 2016,
[10]
Stabilizing l 1 -norm prediction models by supervised feature grouping[J] Iman Kamkar;Sunil Kumar Gupta;Dinh Phung;Svetha Venkatesh Journal of Biomedical Informatics 2016,