一种基于SOM和层次凝聚的中文文本聚类方法

被引:18
作者
朱红灿
孟志青
机构
[1] 湘潭大学管理学院,湘潭大学信息工程学院湖南湘潭,湖南湘潭
关键词
中文文本; 文本聚类; 自组织神经网络(SOM); 向量空间模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类.与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性.
引用
收藏
页数:5
相关论文
共 4 条
[1]
一种基于向量空间模型的文本聚类方法 [J].
刘立平 ;
易华容 ;
何文斌 .
株洲师范高等专科学校学报, 2004, (05) :23-25
[2]
基于SOM算法实现的文本聚类 [J].
张毓敏 ;
谢康林 .
计算机工程, 2004, (01) :75-76+157
[3]
PCCS部分聚类分类:一种快速的Web文档聚类方法 [J].
王爱华 ;
张铭 ;
杨冬青 ;
唐世渭 ;
不详 .
计算机研究与发展 , 2001, (04) :415-421
[4]
一种基于自组织神经网络的中文文本聚类新方法.[J].徐建锁;王正欧;王莉;.情报学报.2003, 06