共 2 条
一种解决大规模数据集问题的核主成分分析算法
被引:20
作者:
史卫亚
郭跃飞
薛向阳
机构:
[1] 复旦大学计算机科学与技术系
来源:
关键词:
核主成分分析;
Gram矩阵;
大规模数据集;
协方差无关;
特征分解;
D O I:
暂无
中图分类号:
TP181 [自动推理、机器学习];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
提出一种大规模数据集求解核主成分的计算方法.首先使用Gram矩阵生成一个Gram-power矩阵,根据线性代数的理论可知,新形成的矩阵和原先的Gram矩阵具有相同的特征向量.因此,可以把Gram矩阵的每一列看成核空间迭代算法的输入样本,这样,无须使用特征分解即可迭代地计算出核主成分.该算法的空间复杂度只有O(m);在大规模数据集的情况下,时间复杂度也降低为O(pkm).实验结果表明了所提出算法的有效性.更为重要的是,在大规模数据集的情况下,当传统的特征分解技术无法使用时,该方法仍然可以提取非线性特征.
引用
收藏
页码:2153 / 2159
页数:7
相关论文