一种解决大规模数据集问题的核主成分分析算法

被引:20
作者
史卫亚
郭跃飞
薛向阳
机构
[1] 复旦大学计算机科学与技术系
关键词
核主成分分析; Gram矩阵; 大规模数据集; 协方差无关; 特征分解;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
提出一种大规模数据集求解核主成分的计算方法.首先使用Gram矩阵生成一个Gram-power矩阵,根据线性代数的理论可知,新形成的矩阵和原先的Gram矩阵具有相同的特征向量.因此,可以把Gram矩阵的每一列看成核空间迭代算法的输入样本,这样,无须使用特征分解即可迭代地计算出核主成分.该算法的空间复杂度只有O(m);在大规模数据集的情况下,时间复杂度也降低为O(pkm).实验结果表明了所提出算法的有效性.更为重要的是,在大规模数据集的情况下,当传统的特征分解技术无法使用时,该方法仍然可以提取非线性特征.
引用
收藏
页码:2153 / 2159
页数:7
相关论文
共 2 条
[1]   An improved algorithm for kernel principal component analysis [J].
Zheng, WM ;
Zou, CR ;
Zhao, L .
NEURAL PROCESSING LETTERS, 2005, 22 (01) :49-56
[2]   Nonlinear component analysis as a kernel eigenvalue problem [J].
Scholkopf, B ;
Smola, A ;
Muller, KR .
NEURAL COMPUTATION, 1998, 10 (05) :1299-1319