基于监督信息特性的主动半监督谱聚类算法

被引:33
作者
王娜
李霞
机构
[1] 深圳大学信息工程学院
基金
广东省自然科学基金;
关键词
谱聚类; 半监督聚类; 主动学习; 监督信息;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
半监督聚类是利用少部分监督信息辅助大量未标签数据进行非监督的学习,其聚类性能的改善依赖于监督信息,因此挖掘适合半监督聚类的监督信息非常关键.提出了一种基于监督信息特性的主动学习策略,即找出同一类中距离相对较远的数据对象对和不同类中距离相对较近的数据对象对组成监督信息,并将其引入谱聚类算法,构建新颖的主动半监督谱聚类算法ASSC(Active Semi-supervised Spectral Clustering).利用该监督信息调整谱聚类中点与点之间的距离矩阵,使类内各点紧聚,类间散布.通过对UCI基准数据集以及人工数据集的实验结果表明,ASSC算法优于采用随机选取监督信息的谱聚类性能.
引用
收藏
页码:172 / 176
页数:5
相关论文
共 5 条
[1]   密度敏感的半监督谱聚类 [J].
王玲 ;
薄列峰 ;
焦李成 .
软件学报, 2007, (10) :2412-2422
[2]   密度敏感的谱聚类 [J].
王玲 ;
薄列峰 ;
焦李成 .
电子学报, 2007, (08) :1577-1581
[3]   基于无监督聚类的入侵检测方法 [J].
罗敏 ;
王丽娜 ;
张焕国 .
电子学报, 2003, (11) :1713-1716
[4]   The complexity of non-hierarchical clustering with instance and cluster level constraints [J].
Davidson, Ian ;
Ravi, S. S. .
DATA MINING AND KNOWLEDGE DISCOVERY, 2007, 14 (01) :25-61
[5]  
Integrating constraints and metric learning in semi-supervised clustering .2 Bilenko M,Basu S,Mooney RJ. Proc.of the21st Int’l Conf.on Machine Learning(ICML2004) . 2004