一种改进的k-means中文文本聚类算法

被引:32
作者
龚静
李安民
机构
[1] 湖南环境生物职业技术学院信息技术系
关键词
k-means算法; 文本聚类; 中文文本; 层次聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
提出了k-means聚类算法中选取初始聚类中心及处理孤立点的新方法,改进了k-means算法对初始聚类中心和孤立点文本很敏感的不足之处,并将改进后的算法应用于中文文本聚类中。实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性。
引用
收藏
页码:52 / 54
页数:3
相关论文
共 1 条
[1]
一种基于SOM和层次凝聚的中文文本聚类方法 [J].
朱红灿 ;
孟志青 .
湘潭大学自然科学学报, 2005, (03)