半监督的改进K-均值聚类算法

被引:12
作者
汪军 [1 ,2 ]
王传玉 [2 ]
周鸣争 [1 ]
机构
[1] 安徽工程科技学院计算机科学与工程系
[2] 安徽工程科技学院应用数理系
关键词
半监督学习; K-均值聚类; 标签样本; 最小生成树;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心。在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性。
引用
收藏
页码:137 / 139
页数:3
相关论文
共 1 条
[1]  
Fuzzy clustering with partial supervision .2 Pedrycz,W,Waletzky,J. IEEE Trans Syst Man and Cybern Part B Cybern . 1997