面向大规模数据集的近邻传播聚类

被引:8
作者
谷瑞军 [1 ]
汪加才 [1 ]
陈耿 [1 ,2 ]
陈圣磊 [1 ]
机构
[1] 南京审计学院信息科学学院
[2] 江苏大学计算机科学与通信工程学院
关键词
近邻传播聚类; 大规模数据集; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用。为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分。实验结果表明,该算法在处理能力和运算速度上优于原算法。
引用
收藏
页码:22 / 24
页数:3
相关论文
共 2 条
[1]   基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[2]   半监督的仿射传播聚类 [J].
王开军 ;
李健 ;
张军英 ;
涂重阳 .
计算机工程, 2007, (23) :197-198+201