基于卷积神经网络和KNN的短文本分类算法研究

被引:42
作者
殷亚博 [1 ]
杨文忠 [1 ]
杨慧婷 [1 ]
许超英 [2 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆大学软件学院
关键词
社交网络; 卷积神经网络; K最近邻; 短文本; 机器学习; 深度学习;
D O I
10.19678/j.issn.1000-3428.0047596
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
为解决传统基于TF-IDF的K最近邻(KNN)分类算法在短文本分类时,出现特征维度过高和数据稀疏的问题,基于卷积神经网络和KNN,提出一种新的短文本分类算法。通过采用神经网络语言模型word2vec对短文本进行词向量的训练,并用训练好的词向量表示文本,使用卷积神经网络对短文本进行抽象特征的提取,在提取出抽象特征的基础上,运用KNN分类器进行短文本分类。分别在短文本中句子数目为2、4、6、8的数据集上进行测试,结果表明,与基于TF-IDF的KNN分类算法相比,该算法在准确率、召回率和F1值上平均提高了10.2%、21.1%和15.5%。
引用
收藏
页码:193 / 198
页数:6
相关论文
共 7 条
[1]   基于卷积神经网络的自适应权重multi-gram语句建模系统 [J].
张春云 ;
秦鹏达 ;
尹义龙 .
计算机科学, 2017, 44 (01) :60-64
[2]   分段卷积神经网络在文本情感分析中的应用 [J].
杜昌顺 ;
黄磊 .
计算机工程与科学, 2017, 39 (01) :173-179
[3]   基于深度信念网络的文本分类算法 [J].
陈翠平 .
计算机系统应用, 2015, 24 (02) :121-126
[4]   一种新型朴素贝叶斯文本分类算法 [J].
邸鹏 ;
段利国 .
数据采集与处理, 2014, 29 (01) :71-75
[5]   基于文本分类TFIDF方法的改进与应用 [J].
张玉芳 ;
彭时名 ;
吕佳 .
计算机工程, 2006, (19) :76-78
[6]   使用KNN算法的文本分类 [J].
张宁 ;
贾自艳 ;
史忠植 .
计算机工程, 2005, (08) :171-172+185
[7]  
Convolutional Neural Networks for Character-level Classification. Ko D G,Song S H,Kang K M,et al. Ieie Transactions on Smart Processing&Computing . 2017