几种降维技术在分类问题中的效果评估

被引:6
作者
詹鹏伟
谢小姣
机构
[1] 广州大学数学与信息科学学院
关键词
降维; PCA; LLE; Isomap; 效果评估;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
高维数据将会给数据分析带来极大的困难,因其所导致的数据分布稀疏化和数据组织效果的下降将会大大影响模型的性能。降维就是用于解决"维度灾难"的方法之一。文章从PCA、LLE、Isomap三种常见的降维方法入手,首先介绍了它们的实现原理,进一步结合KNN、SVM、Random Forest、Naive Bayes以及Logistics Regression模型构建了用于评价三种降维方法的综合交叉模型。结果表明,在文章所使用的数据集中,经过PCA方法与Isomap方法降维后的数据在可视的2维空间上分布较为均匀,而LLE方法分布则较为集中。且使用了PCA与Isomap方法的分类模型训练后的平均准确率高达96.44%与96.90%,高于LLE方法处理后所得的90.74%,PCA与Isomap具有较优的降维效果。本研究中所采用的方法与所得的结果为降维方法的选择提供了有益的参考。
引用
收藏
页码:22 / 23+26 +26
页数:3
相关论文
共 6 条
[1]   基于邻域距离ISOMAP算法的高光谱遥感降维算法 [J].
周颂洋 ;
谭琨 ;
吴立新 .
遥感技术与应用, 2014, 29 (04) :695-700
[2]   主成分分析综合评价应该注意的问题 [J].
林海明 ;
杜子芳 .
统计研究, 2013, 30 (08) :25-31
[3]   融合LLE和ISOMAP的非线性降维方法 [J].
张少龙 ;
巩知乐 ;
廖海斌 .
计算机应用研究, 2014, 31 (01) :277-280
[4]   利用局部线性嵌入的模态识别 [J].
白俊卿 ;
闫桂荣 ;
王成 .
西安交通大学学报, 2013, 47 (01) :85-89+100
[5]   数据降维方法分析与研究 [J].
吴晓婷 ;
闫德勤 .
计算机应用研究, 2009, 26 (08) :2832-2835
[6]   高维数据降维方法研究 [J].
余肖生 ;
周宁 .
情报科学, 2007, (08) :1248-1251