一种基于DASOM的两阶段中文文本聚类方法

被引:4
作者
朱红灿
唐毅
机构
[1] 湘潭大学管理学院
关键词
中文文本; 文本聚类; 动态自组织神经网络(DASOM); 向量空间模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
研究了一种基于动态自组织神经网络(The Dynamic Adaptive Self-Organizing Map Neural Network简称:DA-SOM)的两阶段中文文档聚类方法,第一阶段对中文文本向量进行DASOM训练,第二阶段对虚拟的坐标集聚类。该算法动态地组织DASOM,由文本的内容来决定模型的结构;与直接聚类相比,降低了计算时间;与基于静态SOM文本聚类相比,减少了输出层节点数,改善了聚类效果。通过数值实验对比表明该方法对中文文本聚类具有有效性。
引用
收藏
页码:101 / 104
页数:4
相关论文
共 3 条
[1]   基于SOM算法实现的文本聚类 [J].
张毓敏 ;
谢康林 .
计算机工程, 2004, (01) :75-76+157
[2]  
一种基于自组织神经网络的中文文本聚类新方法[J]. 徐建锁,王正欧,王莉.情报学报. 2003 (06)
[3]  
Organizing and Exploring High-Dimensional Data with The Growing Hierarchical Self-Organizing Map .2 M Dittenbach,D Merkl. Proceedings of the1st International Conference on Fuzzy Systems and Knowledge Discovery(FSKD02) . 2002