基于相关性分析及遗传算法的高维数据特征选择

被引:16
作者
任江涛
黄焕宇
孙婧昊
印鉴
机构
[1] 中山大学计算机科学系
基金
广东省自然科学基金;
关键词
特征选择; 相关性; 遗传算法;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,提出了一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征与类别标签的相关性分析进行特征筛选,只保留与类别标签具有较强相关性的特征,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。
引用
收藏
页码:1403 / 1405
页数:3
相关论文
共 4 条
[1]  
E fficient Feature Selection via Analysis ofRelevanceand Redundancy. YU L,LIU H. Journal ofMach ine Learn ing Research . 2004
[2]  
W rappers for feature subset selection. KOHAVI R,JOHN GH. Artificial Intelligence . 1997
[3]  
Toward Integrating Feature Selection A lgorithm s forC lassification and C lustering. LIU H,YU L. IEEE Transactions on Know ledgeand Data Engineering . 2005
[4]  
Feature subset selection using a geneticalgorithm. YANG J,HONAVAR V. IEEE Intelligent System s . 1998