基于信息熵改进的K-means动态聚类算法

被引:36
作者
杨玉梅
机构
[1] 川北医学院图书馆
关键词
K-means算法; 信息熵; 数据挖掘; 动态聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题。因此,提出一个改进的K-means算法。改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果。实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升。
引用
收藏
页码:254 / 259
页数:6
相关论文
共 12 条
[1]
基于余弦定理和K-means的植物叶片识别方法 [J].
朱颢东 ;
申圳 .
华中师范大学学报(自然科学版), 2014, 48 (05) :650-655
[2]
Optimization of constitutive parameters of foundation soils k-means clustering analysis [J].
Muge Elif Orakoglu ;
Cevdet Emin Ekinci .
Sciences in Cold and Arid Regions, 2013, 5 (05) :626-636
[3]
基于PLSI的标签聚类研究 [J].
吴志媛 ;
钱雪忠 .
计算机应用研究, 2013, 30 (05) :1316-1319
[4]
An accelerated K-means clustering algorithm using selection and erasure rules[J] Suiang-Shyan LEE;Ja-Chen LIN; Journal of Zhejiang University-Science C(Computers & Electronics) 2012, 10
[5]
一种改进的半监督K-Means聚类算法 [J].
袁利永 ;
王基一 .
计算机工程与科学, 2011, 33 (06) :138-143
[6]
基于信息熵的精确属性赋权K-means聚类算法 [J].
原福永 ;
张晓彩 ;
罗思标 .
计算机应用, 2011, 31 (06) :1675-1677
[7]
基于密度的改进K均值算法及实现 [J].
傅德胜 ;
周辰 .
计算机应用, 2011, 31 (02) :432-434
[8]
聚类模式下一种优化的K-means文本特征选择 [J].
刘海峰 ;
刘守生 ;
张学仁 .
计算机科学, 2011, 38 (01) :195-197
[9]
基于密度和最近邻的K-means文本聚类算法 [J].
张文明 ;
吴江 ;
袁小蛟 .
计算机应用, 2010, 30 (07) :1933-1935
[10]
A novel approach for initializing the spherical K -means clustering algorithm[J] Rehab Duwairi;Mohammed Abu-Rahmeh Simulation Modelling Practice and Theory 2015,