基于半监督K-means的K值全局寻优算法

被引:11
作者
孙雪 [1 ]
李昆仑 [1 ]
胡夕坤 [2 ]
赵瑞 [1 ]
机构
[1] 河北大学电子信息工程学院
[2] 河北大学工商学院
关键词
半监督聚类; constrained-K均值; K均值算法; 投票; 阈值;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
提出一种基于半监督K-means的K值全局寻优算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据.结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中数据集的类别标记.实验表明,本文所提出的方法可以有效的寻找适合数据集的最佳K值和聚类的中心,提高聚类性能.
引用
收藏
页码:106 / 109
页数:4
相关论文
共 7 条
  • [1] 一种半监督K均值多关系数据聚类算法
    高滢
    刘大有
    齐红
    刘赫
    [J]. 软件学报, 2008, (11) : 2814 - 2821
  • [2] 基于k-means和半监督机制的单类中心学习算法
    李志圣
    孙越恒
    何丕廉
    侯越先
    [J]. 计算机应用, 2008, (10) : 2513 - 2516
  • [3] 流形上的Laplacian半监督回归
    杨剑
    王珏
    钟宁
    [J]. 计算机研究与发展, 2007, (07) : 1121 - 1127
  • [4] 模糊聚类分析最佳聚类数的确定方法研究
    孙才志
    王敬东
    潘俊
    [J]. 模糊系统与数学, 2001, (01) : 89 - 92
  • [5] 用改进的RPCL算法提取聚类的最佳数目
    李昕
    郑宇
    江芳泽
    [J]. 上海大学学报(自然科学版), 1999, (05) : 409 - 413
  • [6] 机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003
  • [7] Semi-supervised graph clustering: a kernel approach[J] . Brian Kulis,Sugato Basu,Inderjit Dhillon,Raymond Mooney.Machine Learning . 2009 (1)