统计模式识别中的维数削减与低损降维

被引:43
作者
宋枫溪
高秀梅
刘树海
杨静宇
机构
[1] 哈尔滨工业大学深圳研究生院
[2] 淮阴师范学院计算机系
[3] 炮兵学院二系
[4] 南京理工大学计算机系
关键词
维数削减; 特征选择; 特征抽取; 低损降维; 文本分类;
D O I
暂无
中图分类号
O235 [模式识别理论];
学科分类号
070104 ; 081104 ;
摘要
较为全面地回顾了统计模式识别中常用的一些特征选择、特征提取等主流特征降维方法,介绍了它们各自的特点及其适用范围,在此基础上,提出了一种新的基于最优分类器———贝叶斯分类器的可用于自动文本分类及其它大样本模式分类的特征选择方法———低损降维.在标准数据集Reuters-21578上进行的仿真实验结果表明,与互信息、χ2统计量以及文档频率这三种主流文本特征选择方法相比,低损降维的降维效果与互信息、χ2统计量相当,而优于文档频率.
引用
收藏
页码:159 / 166
页数:8
相关论文
共 7 条