基于改进KNN的文本分类方法

被引:17
作者
钱晓东
王正欧
不详
机构
[1] 天津大学系统工程研究所
[2] 天津大学系统工程研究所 天津
[3] 天津
关键词
文本分类; 特征提取; 自组织神经网络; 向量空间模型; K最近邻算法; 模式聚合;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算];
学科分类号
摘要
本文针对VSM (向量空间模型)中KNN (K最近邻算法)在文本处理环境下的不足,根据SOM (自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法。应用特征选取和模式聚合理论以降低特征空间维数。传统的VSM模型各维相同的权重并不适应于文本处理的环境,本文提出应用SOM神经网络进行VSM模型各维权重的计算。结合两种改进,有效地降低了向量空间的维数,提高了文本分类的精度和速度。
引用
收藏
页码:550 / 554
页数:5
相关论文
共 3 条