基于邻域模型的K-means初始聚类中心选择算法

被引:5
作者
曹付元 [1 ,2 ]
梁吉业 [1 ,2 ]
姜广 [1 ,2 ]
机构
[1] 计算智能与中文信息处理省部共建教育部重点实验室
[2] 山西大学计算机与信息技术学院
基金
高等学校博士学科点专项科研基金;
关键词
邻域模型; 初始聚类中心; K-means聚类; 粗糙集;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
传统的K-means算法由于其方法简单,在模式识别和机器学习中被广泛讨论和应用。但由于K-means算法随机选择初始聚类中心,而初始聚类中心的选择对最终的聚类结果有着直接的影响,因此算法不能保证得到一个唯一的聚类结果。利用邻域模型中对象邻域的上下近似,定义了对象邻域耦合度和分离度的概念,给出了对象在初始聚类中心选择中的重要性,提出了一种初始聚类中心的选择算法。另外,分析了邻域模型中三种范数对聚类精度的影响,并和随机选择初始聚类中心、CCIA选择初始聚类中心算法进行了比较,实验结果表明,该算法是有效的。
引用
收藏
页码:181 / 184
页数:4
相关论文
共 9 条
[1]   一种基于动态近邻选择模型的聚类算法 [J].
金阳 ;
左万利 .
计算机学报, 2007, (05) :5756-5762
[2]   基于划分的模糊聚类算法 [J].
张敏 ;
于剑 .
软件学报, 2004, (06) :858-868
[3]   基于免疫规划的K-means聚类算法 [J].
行小帅 ;
潘进 ;
焦李成 .
计算机学报, 2003, (05) :605-610
[4]   基于视觉系统的聚类算法 [J].
张讲社 ;
梁怡 ;
徐宗本 .
计算机学报, 2001, (05) :496-501
[5]   A k-mean clustering algorithm for mixed numeric and categorical data [J].
Ahmad, Amir ;
Dey, Lipika .
DATA & KNOWLEDGE ENGINEERING, 2007, 63 (02) :503-527
[6]   Cluster center initialization algorithm for K-means clustering [J].
Khan, SS ;
Ahmad, A .
PATTERN RECOGNITION LETTERS, 2004, 25 (11) :1293-1302
[7]  
Neighborhood operator systems and approximations[J] . Wei-Zhi Wu,Wen-Xiu Zhang.Information Sciences . 2002 (1)
[8]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90
[9]   Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304