基于改进的ISODATA算法的大样本数据聚类方法研究

被引:6
作者
张丽娜 [1 ]
姜新华 [2 ]
那日苏 [1 ]
机构
[1] 内蒙古师范大学物理与电子信息学院
[2] 内蒙古农业大学计算机与信息工程学院
关键词
ISODATA; 大样本; 黄金分割法; 数据聚类;
D O I
10.16853/j.cnki.1009-3575.2013.01.027
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对数量大、数据结构复杂、离散度大的样本数据的聚类分析,采用ISODATA算法实现。ISODATA算法是1种基于统计模式识别的非监督学习动态聚类方法,是大样本数据聚类分析常用的方法,但该算法需要预先确定初始聚类参数。本文提出了基于黄金分割法来度量聚类的有效性,该方法能动态计算聚类度量参数,以此实现大样本数据的有效聚类。实验证明:该方法能够合理、有效的进行数据聚类。
引用
收藏
页码:133 / 137
页数:5
相关论文
共 6 条
[1]   基于聚类模糊系统的动态数据野值剔除方法 [J].
朱学锋 .
飞行器测控学报, 2011, 30 (05) :81-84
[2]   大样本数据聚类的改进方法 [J].
卞亦文 .
统计与决策, 2009, (01) :12-13
[3]   一种改进的ISODATA算法及在彩色荧光图像中的应用 [J].
何霁 ;
滕奇志 ;
罗代升 ;
何小海 .
四川大学学报(自然科学版), 2007, (03) :563-568
[4]   用迭代自组织数据分析技术A(ISODATA)对零件进行模糊分类 [J].
吴庄胜 ;
支灿 .
西南交通大学学报, 1991, (03) :103-108
[5]  
基于MATLAB与fuzzyTECH的模糊与神经网络设计[M]. 电子工业出版社 , 周润景, 2010
[6]  
On cluster validity for the fuzzy c-means model. Pal NR,Bezdek JC. IEEE Transactions on Fuzzy Systems . 1995