一种基于改进K-means的文档聚类算法的实现研究

被引:8
作者
岑咏华 [1 ,2 ]
王晓蓉 [2 ]
吉雍慧 [1 ]
机构
[1] 南京大学信息管理系
[2] 南京理工大学经济管理学院
关键词
文档聚类; K-means;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在对文档聚类的含义、作用和一般过程的阐述基础上,分析一种基于"最小最大"原则初始质心优选的改进K-means聚类的基本思想,并重点设计相关的聚类算法,实现聚类系统,基于系统对300篇学术文档及其相关特征词语进行聚类实验。实验结果表明,本文所设计和实现的改进K-means的聚类算法表现出较好的性能。
引用
收藏
页码:73 / 79
页数:7
相关论文
共 2 条