使用谱聚类算法解决文本聚类集成问题

被引:15
作者
徐森 [1 ,2 ]
卢志茂 [1 ]
顾国昌 [1 ]
机构
[1] 哈尔滨工程大学模式识别与自然计算研究室
[2] 盐城工学院信息工程学院
基金
高等学校博士学科点专项科研基金;
关键词
聚类集成; 文本聚类; 谱聚类; 矩阵扰动理论; 图上的随机游动;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
采用2个不同的谱聚类算法解决文本聚类集成问题。为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度。分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性。在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题。
引用
收藏
页码:58 / 66
页数:9
相关论文
共 8 条
[1]   复杂网络聚类方法 [J].
杨博 ;
刘大有 ;
金弟 ;
马海宾 .
软件学报, 2009, 20 (01) :54-66
[2]   聚类集成中的差异性度量研究 [J].
罗会兰 ;
孔繁胜 ;
李一啸 .
计算机学报, 2007, (08) :1315-1324
[3]  
Spectral clustering based on matrix perturbation theory[J]. TIAN Zheng1,2, LI XiaoBin1 & JU YanWei1 1 Department of Applied Mathematics, Northwestern Polytechnical University, Xi’an 710072, China;2 National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Science, Beijing 100080, China.Science in China(Series F:Information Sciences). 2007(01)
[4]   基于谱图理论的流形学习算法 [J].
罗四维 ;
赵连伟 .
计算机研究与发展, 2006, (07) :1173-1179
[5]   基于Bagging的选择性聚类集成 [J].
唐伟 ;
周志华 .
软件学报, 2005, (04) :496-502
[6]   A tutorial on spectral clustering [J].
von Luxburg, Ulrike .
STATISTICS AND COMPUTING, 2007, 17 (04) :395-416
[7]  
WCA: A Weighted Clustering Algorithm for Mobile Ad Hoc Networks[J] . Mainak Chatterjee,Sajal K. Das,Damla Turgut.Cluster Computing . 2002 (2)
[8]  
Concept Decompositions for Large Sparse Text Data Using Clustering[J] . Inderjit S. Dhillon,Dharmendra S. Modha.Machine Learning . 2001 (1)