一种半监督K均值多关系数据聚类算法

被引:23
作者
高滢 [1 ,2 ]
刘大有 [1 ,2 ]
齐红 [1 ,2 ]
刘赫 [1 ,2 ]
机构
[1] 吉林大学计算机科学与技术学院
[2] 吉林大学符号计算与知识工程教育部重点实验室
关键词
数据挖掘; 半监督学习; 聚类算法; 多关系数据; K均值聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性.
引用
收藏
页码:2814 / 2821
页数:8
相关论文
共 6 条
  • [1] 模式识别[M]. 清华大学出版社[美]J.P.MarquesdeSa著, 2002
  • [2] CrossClus: user-guided multi-relational clustering[J] . Xiaoxin Yin,Jiawei Han,Philip S. Yu.Data Mining and Knowledge Discovery . 2007 (3)
  • [3] Learning with partly labeled data[J] . Abdelhamid Bouchachia.Neural Computing and Applications . 2007 (3)
  • [4] Prospects and challenges for multi-relational data mining[J] . Pedro Domingos.ACM SIGKDD Explorations Newsletter . 2003 (1)
  • [5] Semi-supervised Learning. Chapelle O,Sch lkopf B,Zien A. MIT Press . 2006
  • [6] Pattern Recognition Concepts,Methods and Applications. Marques JP,Written,Wu YF,Trans. Tsinghua University Press . 2002