近邻传播的文本聚类集成谱算法

被引:9
作者
卢志茂 [1 ]
李纯 [1 ,2 ]
张琦 [1 ]
机构
[1] 哈尔滨工程大学信息与通信工程学院
[2] 中国人民解放军部队
关键词
近邻传播; 聚类集成; 文本聚类; 谱聚类; 矩阵变换;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.
引用
收藏
页码:899 / 905
页数:7
相关论文
共 5 条
[1]   可变相似性度量的近邻传播聚类 [J].
董俊 ;
王锁萍 ;
熊范纶 .
电子与信息学报, 2010, 32 (03) :509-514
[2]  
解决文本聚类集成问题的两个谱算法[J]. 徐森,卢志茂,顾国昌.自动化学报. 2009(07)
[3]   基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[4]   自适应仿射传播聚类 [J].
王开军 ;
张军英 ;
李丹 ;
张新娜 ;
郭涛 .
自动化学报, 2007, (12) :1242-1246
[5]  
Spectral clustering based on matrix perturbation theory[J]. TIAN Zheng1,2, LI XiaoBin1 & JU YanWei1 1 Department of Applied Mathematics, Northwestern Polytechnical University, Xi’an 710072, China;2 National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Science, Beijing 100080, China.Science in China(Series F:Information Sciences). 2007(01)