一种改进K-means算法的聚类算法CARDBK

被引:11
作者
朱烨行 [1 ]
李艳玲 [2 ]
崔梦天 [3 ,4 ]
杨献文 [5 ]
机构
[1] 西安邮电大学经济与管理学院
[2] 第二炮兵工程大学电子工程系
[3] 西南民族大学计算机科学与技术学院
[4] 电子科技大学计算机科学与工程学院
[5] 西安财经学院信息与教育技术中心
基金
中国博士后科学基金;
关键词
聚类; 文档聚类; 文本聚类; K-means; 算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
CARDBK聚类算法与批K-means算法的不同之处在于,每个点不是只归属于一个簇,而是同时影响多个簇的质心值,一个点影响某一个簇的质心值的程度取决于该点与其它离该点更近的簇的质心之间的距离值。从聚类结果的熵、纯度、F1值、Rand Index和NMI等5个性能指标值来看,与多个不同算法在多个不同数据集上分别聚类相比,该算法具有较好的聚类结果;与多个不同算法在同一数据集上很多不同的初始化条件下分别聚类相比,该算法具有较好且稳定的聚类结果;该算法在不同大小数据集上聚类时具有线性伸缩性且速度较快。
引用
收藏
页码:201 / 205
页数:5
相关论文
共 5 条
[1]   文本挖掘中聚类算法的比较研究 [J].
刘泉凤 ;
陆蓓 ;
王小华 .
计算机时代, 2005, (06) :7-8+22
[2]   文本聚类算法的分析与比较 [J].
谷波 ;
张永奎 .
电脑开发与应用, 2003, (11) :4-6
[3]  
应用概率统计[M]. 天津大学出版社 , 梁冯珍等编, 2004
[4]  
J-M eans : a new local search heuristic for minimum sum of squares clustering[J] . Pattern Recognition . 2001 (2)
[5]   Plastic algorithm for adaptive vector quantisation [J].
Ridella, S ;
Rovetta, S ;
Zunino, R .
NEURAL COMPUTING & APPLICATIONS, 1998, 7 (01) :37-51