限秩最大子集问题

被引:0
作者
叶环球
机构
[1] 浙江大学
关键词
贪婪算法; 数值代数; 指数时间算法; 判定条件; 枚举法; 列向量; 正交阵; 中列数; 大子集; 子块;
D O I
暂无
年度学位
2001
学位类型
硕士
导师
摘要
在Internet和其他的很多信息量高度集中的媒体上,信息检索(Information Retrieval,IR)正日益成为一个重要的课题。在潜在语义分析(Latent Semantic Analysis,LSA)方法中,相关子集的选择与低秩矩阵逼近起着重要和关键的作用。本文讨论的限秩最大子集问题(LRMS)便是子集选择问题的一种:对于原来的一个大矩阵A∈Rm×n,和给定的一个正整数p≤r=rank(A),考虑怎样在A中选择一个列子矩阵A0,使得A0的秩为p,且A0是所有A的秩p子矩阵中列数最大的一个。 针对这样一个问题,人们一般采用的是枚举方法,但是枚举法是一个指数时间算法。在实际计算中,计算量很大,不能满足实时性的要求。在第三章中,我们用分而治之的方法来求解LRMS问题。首先,我们给出了一个LRMS问题可以用分而治之方法来求解的充分必要条件和一个可判定条件(充分条件),当原矩阵A是列可分时,LRMS问题可以用分而治之方法来求解。在此基础上,我们进一步给出了判断一个矩阵是列可分的可分准则,此可分准则利用数值代数中常用的QR分解得到。由此,我们得到一个求解LMRS问题的分而治之方法。数值试验表明,分而治之方法比枚举法要大大节省计算时间。 实际上,在第三章中,我们只是解决了原矩阵A是列可分的LRMS问题,那么对于原矩阵A是列不可分的LRMS问题,该如何求解呢?第四章中,我们就针对原矩阵A是列不可分的LRMS问题,提出一个贪婪算法。贪婪算法的思想是:每次“最贪婪的”从剩下的子矩阵中选择一列添加到已知的子矩阵中,或“最贪婪的”从已知的子矩阵中消去一列。这分别构成向前贪婪算法和向后贪婪算法。并且,结合这两种贪婪算法,我们还提出一个混合贪婪算法。这些贪婪算法(特别是向后贪婪算法和混合贪婪算法)都能够很好的得到所需的最优子矩阵。 最后,本文还讨论了数值秩情形的LRMS问题。对于此情况,我们前面提出的算法仍然是适用的。随后,我们还提出了一些还有待解决和可以进一步考虑的问题。
引用
收藏
页数:60
共 7 条
[1]
矩阵计算的理论与方法.[M].徐树方编著;.北京大学出版社.1995,
[2]
拟阵.[M].刘桂真等 著.国防科技大学出版社.1994,
[3]
矩阵数值分析与最优化.[M].(法)西阿尔莱(Ciarlet;P.G.)著;胡健伟译;.高等教育出版社.1990,
[4]
现代图论基础.[M].[日]前田渡;[日]伊东正安 著;陶思雨;王缉惠 译.高等教育出版社.1987,
[5]
矩阵扰动分析.[M].孙继广 著.科学出版社.1987,
[6]
最优化计算方法.[M].席少霖;赵凤治 编著.上海科学技术出版社.1983,
[7]
Closest normal matrix finally found!.[J].Axel Ruhe.BIT.1987, 4