基于近邻传播算法的半监督聚类

被引:158
作者
肖宇
于剑
机构
[1] 北京交通大学计算机与信息技术学院
基金
高等学校博士学科点专项科研基金;
关键词
半监督聚类; 近邻传播; 相似度矩阵; 成对点约束; 先验知识;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
提出了一种基于近邻传播(affinity propagation,简称AP)算法的半监督聚类方法.AP是在数据点的相似度矩阵的基础上进行聚类.对于规模很大的数据集,AP算法是一种快速、有效的聚类方法,这是其他传统的聚类算法所不能及的,比如:K中心聚类算法.但是,对于一些聚类结构比较复杂的数据集,AP算法往往不能得到很好的聚类结果.使用已知的标签数据或者成对点约束对数据形成的相似度矩阵进行调整,进而达到提高AP算法的聚类性能.实验结果表明,该方法不仅提高了AP对复杂数据的聚类结果,而且在约束对数量较多时,该方法要优于相关比对算法.
引用
收藏
页码:2803 / 2813
页数:11
相关论文
共 3 条
  • [1] 密度敏感的半监督谱聚类
    王玲
    薄列峰
    焦李成
    [J]. 软件学报, 2007, (10) : 2412 - 2422
  • [2] Supervised clustering—Algorithms and benefits .2 Erick CF,Zeidat N,Zhao ZH. Proc.of the 16th IEEE Int‘l Conf.on Tools with Artificial Intelligence (ICTAI 2004) . 2004
  • [3] Integrating constraints and metric learning in semi-supervised clustering .2 Bilenko M,Basu S,Mooney RJ. Proc.of the21st Int’l Conf.on Machine Learning(ICML2004) . 2004