一类数据空间网格化聚类算法的均值近似方法(英文)

被引:8
作者
李存华
孙志挥
机构
[1] 东南大学计算机科学与工程系
[2] 东南大学计算机科学与工程系 江苏南京
关键词
聚类; 网格; 基于密度的; 均值近似; 误差估计;
D O I
10.13328/j.cnki.jos.2003.07.011
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着聚类分析对象数据集规模的急剧增大,改进已有的算法以获得满意的效率受到越来越多的重视.讨论了一类采用数据空间网格划分的基于密度的聚类算法的均值近似方法.该方法过滤并释放位于稠密超方格中的数据项,并利用其重心点近似计算其对周围数据元素的影响因子.给出均值近似在聚类算法中的实现策略及其误差估计.均值近似方法在有效减少内存需求、大幅度降低计算复杂度的同时对聚类精确度影响甚微.实验结果验证了该方法能够取得令人满意的效果.
引用
收藏
页码:1267 / 1274
页数:8
相关论文
共 1 条
[1]  
DensityEstimation forStatistics andDataAnalysis .2 SilvermanB. Chapman&Hall . 1986