基于隐含变量的聚类集成模型

被引:15
作者
王红军
李志蜀
成飏
周鹏
周维
机构
[1] 四川大学计算机学院
关键词
聚类集成; 隐含变量; 聚类集成模型; MCMC(Markov chain Monte Carlo);
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
聚类集成能成为机器学习活跃的研究热点,是因为聚类集成能够保护私有信息、分布式处理数据和对知识进行重用,此外,噪声和孤立点对结果的影响较小.主要工作包括:第一,分析了把每一个基聚类器看成是原数据的一个属性这种处理方式的优越性,发现按此方法建立起来的聚类集成算法就具有良好的扩展性和灵活性;第二,在此基础之上,建立了latent variable cluster ensemble(LVCE)概率模型进行聚类集成,并且给出了LVCE模型的Markov chain Monte Carlo(MCMC)算法.实验结果表明,LVCE模型的MCMC算法能够进行聚类集成并且达到良好的效果,同时可以体现数据聚类的紧密程度.
引用
收藏
页码:825 / 833
页数:9
相关论文
共 4 条
[1]   基于Bagging的选择性聚类集成 [J].
唐伟 ;
周志华 .
软件学报, 2005, (04) :496-502
[2]   Clusterer ensemble [J].
Zhou, ZH ;
Tang, W .
KNOWLEDGE-BASED SYSTEMS, 2006, 19 (01) :77-83
[3]   Solving multi-instance problems with classifier ensemble based on constructive clustering [J].
Zhou, Zhi-Hua ;
Zhang, Min-Ling .
KNOWLEDGE AND INFORMATION SYSTEMS, 2007, 11 (02) :155-170
[4]   Vote counting measures for ensemble classifiers [J].
Windeatt, T .
PATTERN RECOGNITION, 2003, 36 (12) :2743-2756