面向稀疏高维大数据的扩展增量模糊聚类算法

被引:21
作者
钱雪忠
姚琳燕
机构
[1] 江南大学物联网工程学院物联网技术应用教育部工程研究中心
关键词
扩展聚类算法; 条件聚类; 稀疏高维大数据; 模糊聚类; 初始中心点;
D O I
10.19678/j.issn.1000-3428.0051839
中图分类号
TP311.13 [];
学科分类号
摘要
模糊C均值(FCM)聚类算法对初始中心点敏感,不考虑类别间中心点的相互影响,且仅能处理低维数据。为此,设计一种改进的初始中心点选择方法,并基于条件模糊聚类思想,将传统FCM算法中的欧氏距离替换为余弦距离后提出wHFCLM算法。将该算法与扩展增量聚类算法spFCM、oFCM和rseFCM相结合,得到对应的扩展增量模糊聚类算法spHF(c+l)M、oHF(c+l)M以及rseHF(c+l)M。实验结果表明,与spFCM算法、oFCM算法和rseFCM算法相比,扩展增量模糊聚类算法对初始中心点的选择敏感性较低,能较好地处理大规模稀疏高维数据集,且在合适的分块大小下具有更优的聚类性能。
引用
收藏
页码:75 / 81+88 +88
页数:8
相关论文
共 6 条
[1]
Incremental kernel fuzzy c-means with optimizing cluster center initialization and delivery [J].
Jiao, Runhai ;
Liu, Shaolong ;
Wen, Wu ;
Lin, Biying .
KYBERNETES, 2016, 45 (08) :1273-1291
[2]
Enhanced soft subspace clustering integrating within-cluster and between-cluster information.[J].Zhaohong Deng;Kup-Sze Choi;Fu-Lai Chung;Shitong Wang.Pattern Recognition.2009, 3
[3]
初始点优化与参数自适应的密度聚类算法 [J].
戴阳阳 ;
李朝锋 ;
徐华 .
计算机工程, 2016, 42 (01) :203-209
[4]
Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法 [J].
冯振华 ;
钱雪忠 ;
赵娜娜 .
计算机应用研究, 2016, 33 (09) :2693-2696+2700
[5]
一种基于代表点的增量聚类算法 [J].
孟凡荣 ;
李晓翠 ;
周勇 .
计算机应用研究, 2012, 29 (08) :2865-2867
[6]
基于扩展凝聚点和网格的增量聚类算法 [J].
陈卓 ;
贺明霞 ;
刘相双 .
哈尔滨工业大学学报, 2006, (08) :1382-1385+1398