基于粗糙集和改进鲸鱼优化算法的特征选择方法

被引:48
作者
王生武 [1 ]
陈红梅 [2 ]
机构
[1] 西南交通大学信息科学与技术学院
[2] 西南交通大学云计算与智能技术高校重点实验室
关键词
特征选择; 粗糙集理论; 改进鲸鱼优化算法; 属性依赖度; 最优特征子集;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
随着互联网和物联网技术的发展,数据的收集变得越发容易。但是,高维数据中包含了很多冗余和不相关的特征,直接使用会徒增模型的计算量,甚至会降低模型的表现性能,故很有必要对高维数据进行降维处理。特征选择可以通过减少特征维度来降低计算开销和去除冗余特征,以提高机器学习模型的性能,并保留了数据的原始特征,具有良好的可解释性。特征选择已经成为机器学习领域中重要的数据预处理步骤之一。粗糙集理论是一种可用于特征选择的有效方法,它可以通过去除冗余信息来保留原始特征的特性。然而,由于计算所有的特征子集组合的开销较大,传统的基于粗糙集的特征选择方法很难找到全局最优的特征子集。针对上述问题,文中提出了一种基于粗糙集和改进鲸鱼优化算法的特征选择方法。为避免鲸鱼算法陷入局部优化,文中提出了种群优化和扰动策略的改进鲸鱼算法。该算法首先随机初始化一系列特征子集,然后用基于粗糙集属性依赖度的目标函数来评价各子集的优劣,最后使用改进鲸鱼优化算法,通过不断迭代找到可接受的近似最优特征子集。在UCI数据集上的实验结果表明,当以支持向量机为评价所用的分类器时,文中提出的算法能找到具有较少信息损失的特征子集,且具有较高的分类精度。因此,所提算法在特征选择方面具有一定的优势。
引用
收藏
页码:44 / 50
页数:7
相关论文
共 15 条
[1]
A Genetic Programming approach for feature selection in highly dimensional skewed data.[J].Felipe Viegas;Leonardo Rocha;Marcos Gonçalves;Fernando Mourão;Giovanni Sá;Thiago Salles;Guilherme Andrade;Isac Sandin.Neurocomputing.2018,
[2]
A new Unsupervised Spectral Feature Selection Method for mixed data: A filter approach.[J].Saúl Solorio-Fernández;José Fco. Martínez-Trinidad;J. Ariel Carrasco-Ochoa.Pattern Recognition.2017,
[3]
Feature selection for high dimensional imbalanced class data using harmony search.[J].Alireza Moayedikia;Kok-Leong Ong;Yee Ling Boo;William GS Yeoh;Richard Jensen.Engineering Applications of Artificial Intelligence.2017,
[4]
The Whale Optimization Algorithm.[J].Seyedali Mirjalili;Andrew Lewis.Advances in Engineering Software.2016,
[5]
Finding rough set reducts with fish swarm algorithm.[J].Yumin Chen;Qingxin Zhu;Huarong Xu.Knowledge-Based Systems.2015,
[6]
Filter-based optimization techniques for selection of feature subsets in ensemble systems [J].
Santana, Laura Emmanuella A. dos S. ;
de Paula Canuto, Anne M. .
EXPERT SYSTEMS WITH APPLICATIONS, 2014, 41 (04) :1622-1631
[7]
A survey on feature selection methods [J].
Chandrashekar, Girish ;
Sahin, Ferat .
COMPUTERS & ELECTRICAL ENGINEERING, 2014, 40 (01) :16-28
[8]
Shadowed sets in the characterization of rough-fuzzy clustering [J].
Zhou, Jie ;
Pedrycz, Witold ;
Miao, Duoqian .
PATTERN RECOGNITION, 2011, 44 (08) :1738-1749
[9]
A rough set approach to feature selection based on ant colony optimization.[J].Yumin Chen;Duoqian Miao;Ruizhi Wang.Pattern Recognition Letters.2009, 3
[10]
Constraint Score: A new filter method for feature selection with pairwise constraints.[J].Daoqiang Zhang;Songcan Chen;Zhi-Hua Zhou.Pattern Recognition.2007, 5