密度敏感的半监督谱聚类

被引:99
作者
王玲
薄列峰
焦李成
机构
[1] 西安电子科技大学智能信息处理研究所
关键词
谱聚类; 半监督聚类; 成对限制; 先验信息;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置]; TP18 [人工智能理论];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ; 0812 ; 0835 ;
摘要
聚类通常被认为是一种无监督的数据分析方法,然而在实际问题中可以很容易地获得有限的样本先验信息,如样本的成对限制信息.大量研究表明,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能.首先分析了在聚类过程中仅利用成对限制信息存在的不足,尝试探索数据集本身固有的先验信息——空间一致性先验信息,并提出利用这类先验信息的具体方法.接着,将两类先验信息同时引入经典的谱聚类算法中,提出一种密度敏感的半监督谱聚类算法(density-sensitivesemi-supervisedspectralclusteringalgorithm,简称DS-SSC).两类先验信息在指导聚类搜索的过程中能够起到相辅相成的作用,这使得DS-SSC算法相对于仅利用成对限制信息的聚类算法在聚类性能上有了显著的提高.在UCI基准数据集、USPS手写体数字集以及TREC的文本数据集上的实验结果验证了这一点.
引用
收藏
页码:2412 / 2422
页数:11
相关论文
共 14 条
[1]  
Normalized cuts and image segmentation. Shi J,Malik J. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2000
[2]  
Learning with local and global consistency. Zhou D,Bousquet O,Lal TN,Weston J,Sch-lkopf B. Advances in Neural Information Processing Systems . 2004
[3]  
Clustering with instance-level constraints. Wagstaff K,Cardie C. Proc.of the17th Int’l Conf.on Machine Learning . 2000
[4]  
From instance-level constraints to space-level constraints:Making the most of prior knowledge in data clustering. Klein D,Kamvar SD,Manning CD. Proc.of the19th Int’l Conf.on Machine Learning . 2002
[5]  
Enhancing image and video retrieval:Learning via equivalence constraint. Hertz T,Shental N,Bar-Hillel A,Weinshall D. Proc.of the IEEE Conf.on Computer Vision and Pattern Recognition . 2003
[6]  
Constrained K-means clustering with background knowledge. Wagstaff K,Cardie C,Rogers S,Schroedl S. Proc.of the18th Int’l Conf.on Machine Learning . 2001
[7]  
UCI Repository of Machine LearningDatabases. BLAKE C L,MERZ C J. http://www.ics.uci.Edu/~mlearn/MLRepository.Html . 1998
[8]  
Spectral learning. Kamvar SD,Klein D,Manning CD. Proc.of the18th Int’l Joint Conf.on Artificial Intelligence . 2003
[9]  
Multiway cuts and spectral clustering. Meila M,Xu L. Technical Report,442 . 2004
[10]  
On spectral clustering:Analysis and an algorithm. Ng AY,Jordan MI,Weiss Y. Advances in Neural Information Processing Systems(NIPS)14 . 2002