高维数据分析中的降维方法研究

被引:0
作者
刘卓
机构
[1] 中国人民解放军国防科学技术大学
关键词
高维数据,降维,本征维数,主成分分析,投影寻踪,局部线性嵌入;
D O I
暂无
年度学位
2002
学位类型
硕士
导师
摘要
本文主要研究高维数据处理中的降维问题和降维方法。第一章首先提出了降维的模型和定义,讨论了相关的问题;第三节讨论“维数祸根”现象和高维空间的稀疏性,通过实例分析其对高维空间的数据分布特性具体影响;第四节讨论了本征维数及其估计的基本问题。 第二章是降维方法的回顾与分析,通过对比和综合若干常用降维方法,依据降维映射的形式提出一种分类方法,而后以降维问题的模型和分类为指导,讨论了几种常用的降维方法,特别是重点分析了经典线性降维方法——主成分分析方法,通过实例说明它不适用于处理非线性问题。 第三章围绕一种新兴的统计降维方法——投影寻踪展开讨论,概述投影寻踪的一般理论,定义了投影指标和投影寻踪的概念,证明了传统的主成分分析方法是投影寻踪的一个特例,证明了正态性与Friedman指标为0的等价性;第三节针对高光谱图像处理问题,从实例和理论两个方面,论证了以信息散度为指标的投影寻踪方法在提取信息的能力上优于以方差大小作为衡量信息量多少标准的主成分分析方法。 第四章是本文的重点内容,研究一种全新的非线性降维方法——局部线性嵌入方法,对它的思想和算法进行了详细的分析,给出算法两个相关定理的证明;第三节对比主成分分析,通过实例说明局部线性嵌入方法的非线性降维特征;第四节在此基础上提出了旨在结合两者优势的组合降维方法;第五节提出了局部线性嵌入方法中存在的若干关键性问题,包括流形的局部性、邻点的选择、本征维数的估计和降维映射的表示,第六节基于局部线性近似的思想提出了一种本征维数的估计方法,设计了实用算法,结合实例对算法中参数的选取进行了讨论;最后一节提出了一种基于局部线性重构的图形分类和识别方法,将其应用于手写体数字的图像分类识别实验,实验得到的分类准确率达96.67%。 本文的主要创新点在于:提出了降维映射和嵌入映射的概念;给出了投影指标的严格定义,证明了两个相关定理;提出了一种用于估计本征维数的方法并设计了实用算法;提出了一种基于局部线性重构思想的分类和识别方法。
引用
收藏
页数:48
共 12 条
[1]
投影寻踪方法与高光谱遥感图像数据特征提取的研究 [J].
刘卓 ;
易东云 .
数学理论与应用, 2003, (01) :76-81
[2]
投影寻踪学习网络分类及其应用 [J].
田铮 ;
刘亚莉 ;
肖华勇 .
西北工业大学学报, 1999, (04) :572-577
[3]
非线性系统高维特征量的稳健投影寻踪建模 [J].
田铮 ;
戎海武 ;
党怀义 .
数学的实践与认识, 1999, (03) :92-96
[4]
投影寻踪学习网络及其在控制系统中的应用展望 [J].
骆晨钟 ;
张志强 ;
邵惠鹤 .
上海交通大学学报, 1999, (05)
[5]
污染物浓度预测的PPR模型 [J].
李祚泳 .
环境科学, 1997, (04)
[6]
声呐目标信号特征量的投影寻踪压缩与目标分类 [J].
田铮 ;
肖华勇 .
西北工业大学学报, 1997, (02)
[7]
投影追踪回归逼近的均方收敛性 [J].
宋立新 ;
成平 .
应用概率统计, 1996, (02) :113-115
[8]
非线性时间序列的投影寻踪建模与预报 [J].
田铮 ;
肖华勇 .
西北工业大学学报, 1995, (03)
[9]
PPR的收敛性和全面攻击导弹数据处理 [J].
田铮 ;
戎海武 .
应用概率统计, 1993, (03) :319-325
[10]
两类探索性投影寻踪指标的渐近性 [J].
张健 .
应用概率统计, 1993, (01) :18-26