基于粒计算的K-medoids聚类算法

被引:41
作者
马箐
谢娟英
机构
[1] 陕西师范大学计算机科学学院
关键词
传统K-medoids聚类算法; 快速K-medoids聚类算法; 粒计算; 等价关系; 聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
传统K-medoids聚类算法的聚类结果随初始中心点不同而波动,且计算复杂度较高不适于处理大规模数据集;快速K-medoids聚类算法通过选择合适的初始聚类中心改进了传统K-medoids聚类算法,但是快速K-medoids聚类算法的初始聚类中心有可能位于同一类簇。为克服传统K-medoids聚类算法和快速K-medoids聚类算法的缺陷,提出一种基于粒计算的K-medoids聚类算法。算法引入粒度概念,定义新的样本相似度函数,基于等价关系产生粒子,根据粒子包含样本多少定义粒子密度,选择密度较大的前K个粒子的中心样本点作为K-medoids聚类算法的初始聚类中心,实现K-medoids聚类。UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明了基于粒计算的K-medoids聚类算法能得到更好的初始聚类中心,聚类准确率和聚类误差平方和优于传统K-medoids和快速K-medoids聚类算法,具有更稳定的聚类结果,且适用于大规模数据集。
引用
收藏
页码:1973 / 1977
页数:5
相关论文
共 8 条
[1]   Research and progress of cluster algorithms based on granular computing [J].
Shifei D. ;
Li X. ;
Hong Z. ;
Liwen Z. .
International Journal of Digital Content Technology and its Applications, 2010, 4 (05) :96-104
[2]  
粒计算.[M].苗夺谦等; 编著.科学出版社.2007,
[3]  
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,
[4]   一种高效的K-medoids聚类算法 [J].
夏宁霞 ;
苏一丹 ;
覃希 .
计算机应用研究, 2010, 27 (12) :4517-4519
[5]   粒计算研究综述 [J].
王国胤 ;
张清华 ;
胡军 .
智能系统学报, 2007, (06) :8-26
[6]   聚类的粒度分析 [J].
王伦文 .
计算机工程与应用 , 2006, (05) :29-31+65
[7]   基于信息粒度与Rough集的聚类方法研究 [J].
安秋生 ;
沈钧毅 ;
王国胤 .
模式识别与人工智能, 2003, 16 (04) :412-417
[8]   聚类/分类中的粒度原理 [J].
卜东波 ;
白硕 ;
李国杰 .
计算机学报, 2002, (08) :810-816