基于句子级学习改进CNN的短文本分类方法

被引:13
作者
韩栋 [1 ]
王春华 [1 ]
肖敏 [2 ]
机构
[1] 黄淮学院信息工程学院
[2] 武汉理工大学计算机科学与技术学院
关键词
短文本分类; 卷积神经网络; 主题句; 句子级监督学习; 文本级监督学习;
D O I
10.16208/j.issn1000-7024.2019.01.043
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型赋予较高权重,通过加权和构建文本模型。通过文本级CNN监督学习,实现文本分类。在两个评论数据集上的实验结果表明,提出方法具有较高的分类准确性。
引用
收藏
页码:256 / 260+284 +284
页数:6
相关论文
共 15 条
[1]  
Hierarchical Attention Networks for Document Classification. YANG Z,YANG D,DYER C,et al. Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies . 2017
[2]   基于知识语义权重特征的朴素贝叶斯情感分类算法 [J].
冀俊忠 ;
张玲玲 ;
吴晨生 ;
吴金源 .
北京工业大学学报, 2014, 40 (12) :1884-1890
[3]   基于LDA主题模型的短文本分类 [J].
杨萌萌 ;
黄浩 ;
程露红 ;
马平 ;
包武杰 .
计算机工程与设计, 2016, 37 (12) :3371-3377
[4]  
Store classification using text-exemplar-similarity and hypotheses-weightedCNN. Huang Chao,Li Hongliang,Li Wei,et al. Journal of Visual Communication&Image Representation . 2017
[5]  
Predicting bug-fix time:Using standard versus topic-based text categorization techniques. Ardimento P,Bilancia M,Monopoli S. International Conference on Discovery Science . 2016
[6]   结合卷积神经网络和词语情感序列特征的中文情感分析 [J].
陈钊 ;
徐睿峰 ;
桂林 ;
陆勤 .
中文信息学报, 2015, 29 (06) :172-178
[7]   基于事件卷积特征的新闻文本分类 [J].
夏从零 ;
钱涛 ;
姬东鸿 .
计算机应用研究, 2017, 34 (04) :991-994
[8]   分段卷积神经网络在文本情感分析中的应用 [J].
杜昌顺 ;
黄磊 .
计算机工程与科学, 2017, 39 (01) :173-179
[9]  
Short text classification based on Wikipedia and Word2vec. W.Liu,Z.Cao,J.Wang,et al. IEEE International Conference on Computer and Communications . 2017
[10]   结合遗传算法的优化卷积神经网络学习方法 [J].
王丽敏 ;
乔玲玲 ;
魏霖静 .
计算机工程与设计, 2017, 38 (07) :1945-1950