基于SOM算法实现的文本聚类

被引:18
作者
张毓敏
谢康林
机构
[1] 上海交通大学计算机科学与工程系
[2] 上海交通大学计算机科学与工程系 上海
[3] 上海
关键词
文本聚类; 自组织特征映射算法; 向量;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
以自组织特征映射(Self-organizing map,SOM)算法作为理论基础,实现了对 文本文档的聚类,并且给出了相应的类别标注,同时对聚类的准确度进行了评价,由于准确 度较低而后提出了把tf·idf计算词权重的方法应用到SOM算法的输入文本向量中去,因此提 高了聚类的平均准确度。
引用
收藏
页码:75 / 76+157 +157
页数:3
相关论文
共 3 条
  • [1] 一种基于向量空间模型的多层次文本分类方法
    刘少辉
    董明楷
    张海俊
    李蓉
    史忠植
    [J]. 中文信息学报, 2002, (03) : 8 - 14+26
  • [2] 文本聚类中的贝叶斯后验模型选择方法
    姜宁
    史忠植
    [J]. 计算机研究与发展, 2002, (05) : 580 - 587
  • [3] Document clustering for electronic meetings: an experimental comparison of two techniques[J] . Dmitri G Roussinov,Hsinchun Chen.Decision Support Systems . 1999 (1)