一种适合检索词推荐的K-means算法最佳聚类数确定方法

被引:3
作者
边鹏 [1 ,2 ]
赵妍 [1 ]
苏玉召 [1 ,2 ]
机构
[1] 中国科学院文献情报中心
[2] 中国科学院研究生院
关键词
K-means聚类; 聚类数; 文本聚类; 个性化推荐;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
从嵌入式NSTL文本推荐系统的检索词推荐需求入手,分析原有方法的不足,引入共词分析方法和分化理论,提出一种新的最佳聚类数确定方法,改进最小类间距离和平均类内距离的计算方法,强化聚类结果的推荐效果,同时使推荐效果可以随着样本数据的变化而动态调整。最后,运用实验验证该方法的有效性。
引用
收藏
页码:107 / 111
页数:5
相关论文
共 6 条
[1]   一种改进的K-means算法最佳聚类数确定方法 [J].
边鹏 ;
赵妍 ;
苏玉召 .
现代图书情报技术, 2011, (09) :34-40
[2]   K-means算法最佳聚类数确定方法 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机应用, 2010, 30 (08) :1995-1998
[3]   一种改进的全局K-均值聚类算法 [J].
谢娟英 ;
蒋帅 ;
王春霞 ;
张琰 ;
谢维信 .
陕西师范大学学报(自然科学版), 2010, (02) :18-22
[4]   共词分析法研究(一)——共词分析的过程与方式 [J].
钟伟金 ;
李佳 .
情报杂志, 2008, (05) :70-72
[5]   用于数据挖掘的聚类算法 [J].
姜园 ;
张朝阳 ;
仇佩亮 ;
周东方 .
电子与信息学报, 2005, (04) :655-662
[6]   An examination of indexes for determining the number of clusters in binary data sets [J].
Dimitriadou, E ;
Dolnicar, S ;
Weingessel, A .
PSYCHOMETRIKA, 2002, 67 (01) :137-159