基于约束动态更新的半监督层次聚类算法

被引:20
作者
周晨曦 [1 ]
梁循 [1 ]
齐金山 [1 ,2 ]
机构
[1] 中国人民大学信息学院
[2] 淮阴师范学院计算机科学与技术学院
基金
北京市自然科学基金;
关键词
半监督聚类; 层次聚类; 约束; 动态更新; Ward算法;
D O I
10.16383/j.aas.2015.c140859
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了一种基于约束动态更新的半监督层次聚类算法.与现存的半监督层次聚类算法类似,该算法也使用了必连和不连约束.但不同的是,该算法并不是在对满足必连约束的数据样本点进行预先划分的基础上依据不连约束进行聚合操作,而是首先将约束扩展为一个闭包,然后在这此基础上直接依据不连约束进行聚合操作,并在聚合的过程中依据聚类结果动态地更新必连和不连约束,以保证最终的聚类结果同时满足必连和不连约束.该算法的优势在于省略了对必连约束的数据样本点进行预先划分的步骤,这一改进能够保证数据样本点获得更为合理的聚合顺序,从而得到更为准确的聚类结果.本文具体给出了该算法基于Ward层次聚类算法的实现,提出了C-Ward算法.实验表明,与其他同类算法相比,无论是在人工模拟数据集还是在现实数据集上,本文提出的算法都表现出了更高的准确性和更强的稳定性.
引用
收藏
页码:1253 / 1263
页数:11
相关论文
共 11 条
[1]   基于贝叶斯网络的半监督聚类集成模型 [J].
王红军 ;
李志蜀 ;
戚建淮 ;
成飏 ;
周鹏 ;
周维 .
软件学报, 2010, 21 (11) :2814-2825
[2]   基于成对约束的判别型半监督聚类分析 [J].
尹学松 ;
胡思良 ;
陈松灿 .
软件学报, 2008, (11) :2791-2802
[3]   基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[4]   基于Tri-Training和数据剪辑的半监督聚类算法 [J].
邓超 ;
郭茂祖 .
软件学报, 2008, (03) :663-673
[5]  
Classifying a high resolution image of an urban area using super-object information[J] . Brian Johnson,Zhixiao Xie.ISPRS Journal of Photogrammetry and Remote Sensing . 2013
[6]  
Robust path-based spectral clustering[J] . Hong Chang,Dit-Yan Yeung.Pattern Recognition . 2007 (1)
[7]  
Clustering aggregation[J] . Aristides Gionis,Heikki Mannila,Panayiotis Tsaparas.ACM Transactions on Knowledge Discovery from Data (TKDD) . 2007 (1)
[8]   Text Classification from Labeled and Unlabeled Documents using EM [J].
Kamal Nigam ;
Andrew Kachites Mccallum ;
Sebastian Thrun ;
Tom Mitchell .
Machine Learning, 2000, 39 :103-134
[9]  
Semi-supervised Learning. Chapelle O,Sch lkopf B,Zien A. MIT Press . 2006
[10]  
Semi-supervised support vector machines for unlabeled data classification. G. Fung,O. Mangasarian. Technical Report 99-05 Data Mining Institute, University of Wisconsin Madison . 1999