面向结构稳定性的分裂-合并聚类算法

被引:4
作者
雷小锋 [1 ]
何涛 [1 ]
李奎儒 [1 ]
谢昆青 [2 ]
丁世飞 [1 ]
机构
[1] 中国矿业大学计算机科学与技术学院
[2] 北京大学信息科学技术学院视觉与听觉国家重点实验室
关键词
聚类算法; 变体混合模型; 结构稳定性; 分裂-合并;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
聚类是在假设数据具有某种群聚结构的前提下根据观察到的无标记样本发现数据的最优划分。现有的聚类算法通常简单地导出假设结构和给定先验下最优或较优的聚类结果,体现为算法对样本分布拟合度的迭代最优化,即算法有效性。实际上,聚类的有效性取决于结构有效性、算法有效性和先验有效性3个方面的因素。基于这种考虑,提出了一种变体混合模型的聚类结构假设,以及判定聚类结构的稳定性的度量和方法,在算法有效的前提下通过单簇的分裂与合并来改进聚类结构的稳定性,并得到最终聚类结果,设计并实现了SMClus聚类算法,通过对模拟数据和真实数据的聚类实验,例证了方法的有效性。
引用
收藏
页码:217 / 222
页数:6
相关论文
共 2 条
[1]   一种基于K-Means局部最优性的高效聚类算法 [J].
雷小锋 ;
谢昆青 ;
林帆 ;
夏征义 .
软件学报, 2008, (07) :1683-1692
[2]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61