DPFS:一种基于动态规划的文本特征选择算法

被引:2
作者
任永功
林楠
机构
[1] 辽宁师范大学计算机与信息技术学院
关键词
特征选择; 相关性; 冗余性; 动态规划;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
在文本特征选择过程中,针对原始特征空间维数过高、计算量过大、并且存在较大不相关性和冗余性,提出了一种基于动态规划思想的文本特征选择算法(DPFS)。首先,结合动态规划思想,基于特征与类别的相关性分析,对原始特征集合进行特征筛选,保留与类别具有强相关性和弱相关性的特征;然后,再次结合动态规划思想,对特征子集做冗余性分析,滤除弱相关且冗余的特征;最后,得到一个近似最优特征子集。实验结果表明,此算法在对数据降维和在降维过程中减少计算量是有效的。
引用
收藏
页码:188 / 191
页数:4
相关论文
共 3 条
[1]   特征选择方法中的信号分析方法研究 [J].
何劲松 ;
施泽生 .
中国科学技术大学学报, 2001, (01) :77-81+59
[2]  
计算机算法设计与分析[M]. 电子工业出版社 , 王晓东, 2007
[3]  
A Comparative Study on FeatureSelection in Text Categorization .2 Yang Yi ming,Pedersen J O. Proceedings of14thInternational Conference on Machine Learning(ICML-97) . 1997