模糊聚类新算法的研究

被引:0
作者
雷鸣
机构
[1] 天津大学
关键词
模糊划分; 硬c均值聚类; 模糊c均值聚类; 混合型数据模糊聚类; 聚类有效性;
D O I
暂无
年度学位
2007
学位类型
博士
导师
摘要
模糊聚类分析是模糊模式识别范畴中的一个重要分支,是一种无监督的模式识别方法。在众多的领域得到了广泛的应用。比如分类学、地质学、商业活动、模式识别和图像处理等很多方面。研究模糊聚类的算法及其应用具有十分重要的价值,聚类的目标就是在庞大的数据集中发现潜在的数据结构,将类似的样本尽可能地划分在同一类内。由于模糊聚类得到了样本属于各个类别的不确定性程度,表达了样本类属的模糊性,即建立起了样本对于类别的不确定性描述,更能客观地反映现实世界。 如今,模糊聚类已发展成庞大的体系。在实际中用处较大的是基于模糊关系和相似关系的聚类算法以及基于目标函数的聚类算法。模糊c均值聚类算法是最早的目标函数聚类算法,也是目标函数聚类算法中研究得比较充分的算法。但是,在模糊c均值聚类算法以往的研究中仍旧存在薄弱环节和不足之处。模糊c均值聚类算法及其推广形式的主要缺点是对初始化较敏感,收敛速度较慢,对噪声较敏感,不适用于类与类之间的样本量相差较大的情形。目前,针对模糊c均值聚类算法及其推广形式的不足,己提出了各种各样的算法。本文首先对传统的模糊c均值聚类算法进行了分析,讨论了模糊c均值聚类中隶属度的新解释。其次,针对区间型数据,提出了相应的区间型数据模糊c均值聚类算法,将区间长度和区间中值共同作为模糊聚类的要素,这在一定程度上克服了传统区间型数据模糊c均值聚类算法的不足。再次,针对现有关于混合型数据的模糊聚类算法存在的缺陷,提出了改进的针对混合型数据的模糊c均值聚类算法。该算法对符号型数据和模糊数据使用了新的距离测度公式,在此基础上给出了改进的混合型数据模糊c均值聚类算法。实验表明新的算法在应对混合型数据的模糊聚类问题上有很好的结果。最后对聚类有效性问题进行了研究,讨论了三种基于模糊划分的聚类有效性函数。这三种聚类有效性函数分别依据可能性分布,香农熵和子集测度。
引用
收藏
页数:107
共 21 条
[1]
模糊聚类新算法与聚类有效性问题研究 [D]. 
范九伦 .
西安电子科技大学,
1998
[2]
[3]
硬聚类和模糊聚类的结合——双层FCM快速算法 [J].
谢维信 ;
刘健庄 .
模糊系统与数学, 1992, (02) :77-85+132
[4]
自组织神经网络雷达目标识别的研究 [J].
许俊刚 ;
柯有安 .
北京理工大学学报, 1992, (03) :67-72
[5]
动态Fuzzy图最大树聚类分析 [J].
丁斌 .
数值计算与计算机应用, 1992, (02) :157-160
[6]
基于二维直方图的图象模糊聚类分割方法 [J].
刘健庄 .
电子学报, 1992, (09) :40-46
[7]
模糊聚类分析及其应用.[M].高新波著;.西安电子科技大学出版社.2004,
[8]
模糊数学及其应用.[M].李安贵等编;.冶金工业出版社.1994,
[9]
模糊聚类分析及其应用.[M].李相镐等编著;.贵州科技出版社.1994,
[10]
A tabu search-based algorithm for the Fuzzy Clustering Problem [J].
Al-Sultan, KS ;
Fedjki, CA .
PATTERN RECOGNITION, 1997, 30 (12) :2023-2030