一种改进的K-means算法最佳聚类数确定方法

被引:12
作者
边鹏 [1 ,2 ]
赵妍 [3 ]
苏玉召 [1 ,2 ]
机构
[1] 中国科学院国家科学图书馆
[2] 中国科学院研究生院
[3] 郑州航空工业管理学院计算机科学与应用系
关键词
K-means聚类; 聚类数; 文本聚类; 推荐系统;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对BWP方法进行研究,从嵌入式NSTL个性化推荐的文本聚类需求入手,分析BWP方法的不足,提出一种改进的K-means算法最佳聚类数确定方法。对单一样本类的类内距离计算方法进行优化,扩展BWP方法适用的聚类数范围,使原有局部最优的聚类数优化为全局最优。实验结果可以验证该方法具有良好性能。
引用
收藏
页码:34 / 40
页数:7
相关论文
共 5 条
[1]   K-means算法最佳聚类数确定方法 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机应用, 2010, 30 (08) :1995-1998
[2]   一种改进的全局K-均值聚类算法 [J].
谢娟英 ;
蒋帅 ;
王春霞 ;
张琰 ;
谢维信 .
陕西师范大学学报(自然科学版), 2010, (02) :18-22
[3]   用于数据挖掘的聚类算法 [J].
姜园 ;
张朝阳 ;
仇佩亮 ;
周东方 .
电子与信息学报, 2005, (04) :655-662
[4]   初始中心优化的K-Means聚类算法 [J].
李飞 ;
薛彬 ;
黄亚楼 .
计算机科学, 2002, (07) :94-96
[5]   An examination of indexes for determining the number of clusters in binary data sets [J].
Dimitriadou, E ;
Dolnicar, S ;
Weingessel, A .
PSYCHOMETRIKA, 2002, 67 (01) :137-159