一种基于密度的K-means算法研究

被引:43
作者
张琳
陈燕
汲业
张金松
机构
[1] 大连海事大学交通运输管理学院
基金
高等学校博士学科点专项科研基金;
关键词
K-means算法; 基于密度; 类内距离; 类间距离;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距离的比值作为准则评价函数,将准则函数取得最小值时的聚类数作为最佳聚类数,这些改进有效地克服了K-means算法的不足。最后通过几个实例介绍了改进后算法的具体应用,实例表明改进后的算法比原算法有更高的聚类准确性,更能实现类内紧密类间远离的聚类效果。
引用
收藏
页码:4071 / 4073+4085 +4085
页数:4
相关论文
共 12 条
  • [1] K-means算法最佳聚类数确定方法[J].周世兵,徐振源,唐旭清. 计算机应用.2010(08)
  • [2] 一种有效的k-means聚类初始中心选取方法[J].任景彪,尹绍宏. 计算机与现代化.2010(07)
  • [3] K均值聚类算法初始质心选择的改进[J].孙可,刘杰,王学颖. 沈阳师范大学学报(自然科学版).2009(04)
  • [4] 一种基于密度最大值的聚类算法[J].王晶,夏鲁宁,荆继武. 中国科学院研究生院学报.2009(04)
  • [5] 一种优化初始中心点的K-Means文本聚类算法[J].朱颢东,钟勇,赵向辉. 郑州大学学报(理学版).2009(02)
  • [6] 一种优化初始中心点的K-means算法[J].汪中,刘贵全,陈恩红. 模式识别与人工智能.2009(02)
  • [7] 数据挖掘聚类算法研究[J].喻彪,骆雯,赖朝安. 现代制造工程.2009(03)
  • [8] 一种改进的k-means算法[J].严华. 计算机与现代化.2009(01)
  • [9] 基于均衡化函数的k均值优化算法[J].钱雪忠,施培蓓,张明阳,汪中. 计算机工程.2008(14)
  • [10] 初始聚类中心优化的k-means算法[J].袁方,周志勇,宋鑫. 计算机工程.2007(03)