学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种改进的k-means中文文本聚类算法
被引:32
作者
:
论文数:
引用数:
h-index:
机构:
龚静
李安民
论文数:
0
引用数:
0
h-index:
0
机构:
湖南环境生物职业技术学院信息技术系
李安民
机构
:
[1]
湖南环境生物职业技术学院信息技术系
来源
:
湖南工业大学学报
|
2008年
/ 02期
关键词
:
k-means算法;
文本聚类;
中文文本;
层次聚类;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
提出了k-means聚类算法中选取初始聚类中心及处理孤立点的新方法,改进了k-means算法对初始聚类中心和孤立点文本很敏感的不足之处,并将改进后的算法应用于中文文本聚类中。实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性。
引用
收藏
页码:52 / 54
页数:3
相关论文
共 1 条
[1]
一种基于SOM和层次凝聚的中文文本聚类方法
[J].
朱红灿
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学管理学院,湘潭大学信息工程学院湖南湘潭,湖南湘潭
朱红灿
;
孟志青
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学管理学院,湘潭大学信息工程学院湖南湘潭,湖南湘潭
孟志青
.
湘潭大学自然科学学报,
2005,
(03)
←
1
→
共 1 条
[1]
一种基于SOM和层次凝聚的中文文本聚类方法
[J].
朱红灿
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学管理学院,湘潭大学信息工程学院湖南湘潭,湖南湘潭
朱红灿
;
孟志青
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学管理学院,湘潭大学信息工程学院湖南湘潭,湖南湘潭
孟志青
.
湘潭大学自然科学学报,
2005,
(03)
←
1
→