关联语义结合卷积神经网络的文本分类方法

被引:14
作者
魏勇
机构
[1] 河南工学院计算机科学与技术系
关键词
文本分类; 关联语义; 卷积神经网络; 最大池化;
D O I
10.14107/j.cnki.kzgc.170783
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对传统文本分类方法中没有考虑单词语义信息的问题,提出一种结合关联语义和卷积神经网络(CNN)的文本分类方法。首先,对文本进行预处理提取出词干。然后,将每个单词与其相关联的上下文单词相结合,以此构建包含语义信息的词向量。接着,将文本的词向量矩阵输入到CNN中,通过卷积层和最大池化层来获得最佳特征,通过输出层获得分类概率。最后,以最小化代价函数来训练CNN模型,以此构建最终的文本分类器。在2个中文数据集上的实验结果表明,该方法能够实现文本的准确分类,具有可行性和有效性。
引用
收藏
页码:367 / 370
页数:4
相关论文
共 7 条
[1]
基于相关度的局部潜在语义分析算法研究 [J].
吴勇 ;
刘钰峰 .
控制工程, 2017, 24 (08) :1701-1706
[2]
基于概率语义分布的短文本分类 [J].
马成龙 ;
颜永红 .
自动化学报, 2016, 42 (11) :1711-1717
[3]
基于事件卷积特征的新闻文本分类 [J].
夏从零 ;
钱涛 ;
姬东鸿 .
计算机应用研究, 2017, 34 (04) :991-994
[4]
一种基于聚类的PU主动文本分类方法 [J].
刘露 ;
彭涛 ;
左万利 ;
戴耀康 .
软件学报, 2013, 24 (11) :2571-2583
[5]
KNN with TF-IDF based Framework for Text Categorization.[J].Bruno Trstenjak;Sasa Mikac;Dzenana Donko.Procedia Engineering.2014, C
[6]
A comparative study of TF*IDF; LSI and multi-words for text classification.[J].Wen Zhang;Taketoshi Yoshida;Xijin Tang.Expert Systems With Applications.2010, 3
[7]
A sparse version of the ridge logistic regression for large-scale text categorization.[J].Sujeevan Aseervatham;Anestis Antoniadis;Eric Gaussier;Michel Burlet;Yves Denneulin.Pattern Recognition Letters.2010, 2