一个基于K-means的聚类算法的实现

被引:20
作者
谭勇
荣秋生
机构
[1] 湖北民族学院信息工程学院
[2] 湖南文理学院计算机科学与技术系
关键词
数据挖掘; 聚类; K-Means;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-means算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果.
引用
收藏
页码:69 / 71
页数:3
相关论文
共 3 条
[1]  
An efficient k-means clustering algorithm. Alsabti K,Ranka S,Singh V. IPPS- 98, Proceedings of the First Workshop on High Performance Date Mining . 1998
[2]  
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. Ester M,Kriegel H P,Sander J,et al. Proc. 2nd Int. Conf.on Knowledge Discovery and Data Mining. Portland . 1996
[3]  
Data Mining: Concepts and Techniques. Jiawei Han,Micheline Kamber. . 2000