基于目标函数的模糊聚类新算法及其应用研究

被引:0
作者
汪庆淼
机构
[1] 江苏大学
关键词
模糊聚类; 目标函数; 模糊c均值聚类(FCM); 可能性c均值聚类(PCM); 不平衡数据集; 聚类算法均衡化; 模糊控制指标; m值广义化; 粒子群算法(PSO); 粒子群广义化; 自适应m值;
D O I
暂无
年度学位
2014
学位类型
博士
导师
摘要
聚类分析是统计模式识别中无监督分类的一个重要分支,基于实际问题的需要,聚类分析在近三十年的研究及应用中得到飞速的发展。由于能更准确描述模式间的不确定关系,模糊聚类算法研究发展成为聚类分析领域的研究热点。基于目标函数的模糊聚类算法将聚类分析问题转换为一个带约束条件的优化数学问题,通过求解条件优化问题的解从而确定数据集的模糊划分及聚类结果。此类算法具有较好直观理解、算法设计简单、聚类效果良好、易于推广应用等优点,在模式识别及分类、图形图像处理、以及计算机视觉等众多领域中获得了成功的应用,从而成为数据挖掘和机器学习领域的研究热点。 模糊c均值聚类(FCM)及可能性c均值聚类(PCM)是两种典型的基于目标函数的模糊聚类算法,本文综述了这两种算法的研究现状,针对聚类算法的四个研究方面:平衡不平衡数据集模糊聚类、多模糊指标广义化、基于PSO算法的模糊指标广义化、模糊指标自适应寻优进行了研究,主要的工作如下: (1)针对平衡或不平衡数据集分类问题,说明了聚类分析与有监督分类关于不平衡数据集问题的区别,分析了聚类分析针对平衡或不平衡数据集分类应满足的基本性质,指出模糊聚类结果不均衡的原因在于对样本容量的忽略,提出了模糊聚类算法均衡化的概念、基本原理和实现方法,通过在聚类算法目标函数中引入被忽略的样本容量信息可实现算法均衡化。基于模糊聚类算法均衡化的原理,对FCM及PCM算法进行了均衡化处理,得到均衡FCM算法及均衡PCM算法。由于目标函数的复杂性,无法利用梯度信息得到模糊隶属度迭代公式,引入粒子群生物群智能优化算法对模糊隶属度进行估计,实现了聚类算法对于平衡或不平衡数据集统一形式的有效分类。 (2)研究了聚类算法多模糊指标的广义化。分析了FCM算法聚类收敛的基本原理,解析了FCM算法选择极小值点迭代进而实现目标函数单调递减的算法构造,揭示了多模糊指标与原有单一模糊指标的关系,即非最速下降迭代路径和最速下降迭代路径的关系,从而提出聚类算法模糊指标广义化的概念及实现途径。对FCM及PCM算法施行模糊指标广义化,得到了广义FCM及广义PCM算法,使得原有聚类算法成为广义化算法的特例,扩展了模糊指标的取值范围并可得到多种算法迭代路径,丰富和优化了聚类算法的聚类结果。另外也分析了FCM算法模糊指标m≤1时的各取值阶段特性,从反面验证了FCM算法不能取值m≤1的原因。 (3)研究了基于粒子群算法的模糊指标广义化。在模糊指标广义化研究的基础上,对模糊指标取值范围进行了分析讨论,受限于FCM算法目标函数对模糊隶属度二阶海塞(Hesse)矩阵正定的要求,FCM算法模糊指标m要求大于1,通过理论分析发现,利用粒子群算法对模糊隶属度进行估计,可放宽m值约束要求为大于0,从而提出模糊指标粒子群广义化的想法,在此基础上对FCM及PCM算法进行粒子群广义化处理,采用粒子群算法对模糊隶属度解空间寻优,放松了梯度法所求模糊隶属度迭代公式对m>1的要求,从而进一步拓展了聚类算法模糊指标取值空间,优化了聚类算法的寻优路径。 (4)在模糊指标自适应寻优方面,总结并分析了传统模糊指标m值确定方法的分类、基本原理及存在的不足,讨论了模糊指标与模糊隶属度、聚类中心三者的相互关系及对于聚类算法的价值意义。说明了模糊指标的取值应与模糊隶属度及聚类中心的迭代寻优相互关联,指出其取值应满足动态、自适应及目标函数存在模糊指标极值的基本要求,提出利用粒子群算法并基于实际数据对模糊指标进行自适应寻优的设想。对FCM及PCM算法进行了模糊指标自适应寻优处理,通过改造FCM及PCM算法目标函数,使目标函数对模糊指标存在极值,采用粒子群算法对模糊指标及模糊隶属度进行估计,实现了聚类算法对模糊指标与模糊隶属度、聚类中心三参量动态自适应寻优的目的。
引用
收藏
页数:118
共 37 条
[1]
最优化理论与方法.[M].袁亚湘;孙文瑜著;.科学出版社.1997,
[2]
基于模糊聚类的推测多线程划分算法 [J].
李远成 ;
阴培培 ;
赵银亮 .
计算机学报, 2014, 37 (03) :580-592
[3]
基于视觉感知的模糊C均值聚类算法 [J].
潘改 ;
高立群 ;
依玉峰 .
东北大学学报(自然科学版), 2012, 33 (12) :1690-1693+1730
[4]
广义均衡模糊C均值聚类算法 [J].
文传军 ;
詹永照 ;
柯佳 .
系统工程理论与实践, 2012, (12) :2751-2755
[5]
基于预测状态表示的多变量概率系统预测 [J].
汪庆淼 ;
鞠时光 .
计算机应用, 2012, 32 (11) :3044-3046
[6]
基于预测状态表示模型和稀疏分布记忆的多观测系统预测 [J].
汪庆淼 ;
鞠时光 .
计算机应用研究, 2012, 29 (08) :2988-2990
[7]
基于模糊聚类视区划分的SAR目标识别方法 [J].
李娜 ;
刘方 .
电子学报, 2012, 40 (02) :394-399
[8]
粒子群优化算法的收敛性分析及其混沌改进算法 [J].
刘洪波 ;
王秀坤 ;
谭国真 .
控制与决策, 2006, (06) :636-640+645
[9]
基于粒子群的K均值聚类算法 [J].
刘靖明 ;
韩丽川 ;
侯立文 .
系统工程理论与实践, 2005, (06) :54-58
[10]
最大散度差和大间距线性投影与支持向量机 [J].
宋枫溪 ;
程科 ;
杨静宇 ;
刘树海 .
自动化学报, 2004, (06) :890-896