共 2 条
面向大规模数据集的近邻传播聚类
被引:8
作者:
谷瑞军
[1
]
汪加才
[1
]
陈耿
[1
,2
]
陈圣磊
[1
]
机构:
[1] 南京审计学院信息科学学院
[2] 江苏大学计算机科学与通信工程学院
来源:
关键词:
近邻传播聚类;
大规模数据集;
数据挖掘;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用。为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分。实验结果表明,该算法在处理能力和运算速度上优于原算法。
引用
收藏
页码:22 / 24
页数:3
相关论文