基于CF-树的k-means聚类算法的改进

被引:19
作者
张艳芳
李晋宏
曹丹阳
魏金强
机构
[1] 北方工业大学信息工程学院
关键词
k-means算法; CF-树; 信息粒度;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
对CF-树进行了改进,并在此基础上提出了一种新的基于改进CF-树的k-means聚类算法。该算法明显地改善了k-means算法所存在的在大数据集上的时间复杂性高、对噪声和孤立点数据敏感、不适合发现非凸面形状的簇或大小差别很大的簇等缺点。结果证明该算法提高了聚类的效率和准确性。
引用
收藏
页码:42 / 45
页数:4
相关论文
共 1 条
[1]
BIRCH: A new data clustering algorithm and its applications [J].
Zhang, T ;
Ramakrishnan, R ;
Livny, M .
DATA MINING AND KNOWLEDGE DISCOVERY, 1997, 1 (02) :141-182