一类模糊聚类算法研究及其应用

被引:0
作者
曲福恒
机构
[1] 吉林大学
关键词
模糊聚类; 特征空间; 收敛性; 聚类有效性; 全局优化; 无监督多尺度聚类;
D O I
暂无
年度学位
2009
学位类型
博士
导师
摘要
聚类分析作为一个重要的工具已经广泛应用于多个领域(?)模糊聚类算法由于具有良好的聚类性能与数据表达能力,已经成为近年来研究的热点.本文对当前主要的模糊聚类算法进行了研究,针对这些算法中存在的不完善之处提出了相应的改进算法,并对一类基于核的模糊聚类算法的收敛性给出了理论上的证明.本文所作的工作归纳起来主要有以下几点: 一、深入研究了FCM类算法,提出了一种新的基于核的模糊聚类模型(IKFCM聚类模型),并得到三种不同形式的IKFCM聚类算法-IKFCM1、IKFCM2和IKDFCM算法.IKFCM1、IKFCM2算法通过核函数将数据映射到高维的特征空间,提高了算法发现非线性可分形状聚类结构的能力.IKDFCM算法利用核化距离作为聚类的相异性测度,对噪声与野值点有着更好的鲁棒性,计算的时间空间复杂度相对较低. 二、证明了IKFCM算法与基于核的FCM算法(KFCM)的收敛性,这是对原有非核聚类算法收敛性定理的一种推广.收敛性定理表明特征空间内的此类模糊聚类算法的收敛性与数据核矩阵的秩之间有着密切的关系,核化距离形式算法的收敛性与核函数的凸性之间存在着密切的关系. 三、提出了带有凸包约束的(核)可能性聚类模型,并引入全局优化技术对提出的模型进行求解,较好的解决了原始算法容易陷入局部极值与鞍点的问题.提出的算法对解的可行域进行限制,克服了原始算法中易产生重合聚类的不足,并且比普通的基于优化技术的(核)可能性聚类具有更高的效率. 四、提出了利用迭代不动点的吸引域进行聚类的想法,并引入了一种新的聚类有效性指标,得到了一种新的均值漂移聚类算法及其快速算法,算法避免了FCM类算法中人为对初始中心作出假设的不足,并实现了对大数据集的聚类.
引用
收藏
页数:125
共 26 条
[1]
聚类集成关键技术研究 [D]. 
罗会兰 .
浙江大学,
2007
[2]
一类数据空间网格化聚类算法的均值近似方法(英文) [J].
李存华 ;
孙志挥 .
软件学报, 2003, (07) :1267-1274
[3]
基于密度的增量式网格聚类算法(英文) [J].
陈宁 ;
陈安 ;
周龙骧 .
软件学报, 2002, (01) :1-7
[4]
机器学习及其应用.[M].王珏;周志华;周傲英主编;.清华大学出版社.2006,
[5]
非线性方程组迭代解法.[M].冯果忱编著;.上海科学技术出版社.1989,
[6]
A tutorial on spectral clustering [J].
von Luxburg, Ulrike .
STATISTICS AND COMPUTING, 2007, 17 (04) :395-416
[7]
A novel kernelized fuzzy C-means algorithm with application in medical image segmentation [J].
Zhang, DQ ;
Chen, SC .
ARTIFICIAL INTELLIGENCE IN MEDICINE, 2004, 32 (01) :37-50
[8]
A clustering method based on boosting [J].
Frossyniotis, D ;
Likas, A ;
Stafylopatis, A .
PATTERN RECOGNITION LETTERS, 2004, 25 (06) :641-654
[9]
Clustering validity checking methods.[J].Maria Halkidi;Yannis Batistakis;Michalis Vazirgiannis.ACM SIGMOD Record.2002, 3
[10]
Model-based clustering, discriminant analysis, and density estimation [J].
Fraley, C ;
Raftery, AE .
JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 2002, 97 (458) :611-631