双层随机游走半监督聚类

被引:25
作者
何萍
徐晓华
陆林
陈崚
机构
[1] 扬州大学信息工程学院计算机系
关键词
半监督聚类; 点对约束; 随机游走; 组件; 影响扩散;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
半监督聚类旨在根据用户给出的必连和不连约束,把所有数据点划分到不同的簇中,从而获得更准确、更加符合用户要求的聚类结果.目前的半监督聚类算法大多数通过修改已有的聚类算法或者结合度规学习,使聚类结果与点对约束尽可能地保持一致,却很少考虑点对约束对周围无约束数据的显式影响程度.提出一种由在顶点上的低层随机游走和在组件上的高层随机游走两部分构成的双层随机游走半监督聚类算法,其中,低层随机游走主要负责计算选出的约束顶点对其他顶点的影响范围和影响程度,称为组件;高层随机游走则进一步将各个点对约束以自适应的强度在组件上进行约束传播,把它们在每个顶点上的影响综合在一个簇指示矩阵中.UCI数据集和大型真实数据集上的实验结果表明,双层随机游走半监督聚类算法比其他半监督聚类算法更准确,也比较高效.
引用
收藏
页码:997 / 1013
页数:17
相关论文
共 4 条
[1]
基于贝叶斯网络的半监督聚类集成模型 [J].
王红军 ;
李志蜀 ;
戚建淮 ;
成飏 ;
周鹏 ;
周维 .
软件学报, 2010, 21 (11) :2814-2825
[2]
基于成对约束的判别型半监督聚类分析 [J].
尹学松 ;
胡思良 ;
陈松灿 .
软件学报, 2008, (11) :2791-2802
[3]
基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[4]
Semi-supervised graph clustering: a kernel approach[J] Brian Kulis;Sugato Basu;Inderjit Dhillon;Raymond Mooney Machine Learning 2009,