模式分类中特征选择问题的研究

被引:0
作者
孙伟艳
机构
[1] 哈尔滨理工大学
关键词
特征选择; 搜索策略; 评价准则; 互信息; 相关性;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
特征选择在数据分析和预处理步骤中发挥着重要的作用,通过特征选择可以删除无关、冗余的信息,降低训练样本的维数、降低算法的复杂度和噪音的干扰,提高模型的推广能力,因而在分类问题中起着很重要的作用。一个特征选择的过程在原理上可以看成是一个组合优化过程:在原有的特征中选择其中的一部分,使某个给定的评价函数最优。 特征选择框架指出一个特征选择算法是由“特征子集生成”、“特征子集评价”、“停止条件”和“结果验证”四个部分组成的。 首先,本文基于这个框架,总结归纳了常用特征选择算法的搜索策略和评价准则。 然后,本文研究了常用的几种搜索算法:B&B算法、连续选择算法、增l减r法、浮动搜索算法。本文给出了这几种搜索算法在同一数据集上基于类内类间距离这一评价准则下的实验结果,并进行了比较,验证了理论分析。 其次,本文详细分析了评价准则中的互信息对于特征选择的意义,以及从样本出发来计算互信息量的方法。采用窗函数估计的非参数密度估计方法,实现了一种基于互信息量的特征选择算法,并在人工数据集和实际数据集上进行了实验验证,对结果进行了分析。同时,把互信息准则与其它的距离准则作了一下比较。 最后,本文研究了特征选择中特征的相关性和冗余性,以特征与类别以及特征与特征之间的关联性为标准,提出了一种基于相关分析的特征选择方法,该方法直接从原始特征集中抽取相关性小且分类能力强的特征子集,大大降低了特征空间的维数,减小了运算量。
引用
收藏
页数:69
共 20 条
[1]
特征选择算法及其在基于内容图像检索中的应用研究 [D]. 
李云 .
重庆大学,
2005
[2]
模式识别.[M].边肇祺等编著;.清华大学出版社.2000,
[3]
基于相关性分析的特征选择方法研究 [J].
何志文 ;
李夕海 ;
刘代志 ;
张斌 .
核电子学与探测技术, 2005, (06)
[4]
基于结构自适应神经网络特征选择的一种改进方法 [J].
王春迎 ;
郝士琦 ;
李洪淘 ;
陈修桥 .
电光与控制, 2005, (05) :32-35
[5]
基于遗传算法和模拟退火算法的特征选择方法 [J].
刘素华 ;
侯惠芳 ;
李小霞 .
计算机工程, 2005, (16) :157-159
[6]
基于K-均值聚类的无监督的特征选择方法 [J].
张莉 ;
孙钢 ;
郭军 .
计算机应用研究, 2005, (03) :23-24+42
[7]
基于特征选择的神经网络集成方法 [J].
凌锦江 ;
陈兆乾 ;
周志华 .
复旦学报(自然科学版), 2004, (05) :685-688
[8]
基于Relief的组合式特征选择 [J].
张丽新 ;
王家廞 ;
赵雁南 ;
杨泽红 .
复旦学报(自然科学版), 2004, (05) :893-898
[9]
基于特征关联性的特征选择算法研究 [J].
李云 ;
叶春晓 ;
李季 ;
刘嘉敏 ;
吴中福 .
微型机与应用, 2004, (06) :58-60
[10]
基于遗传算法的特征选择方法 [J].
赵云 ;
刘惟一 .
计算机工程与应用, 2004, (15) :52-54