基于KACC模型的文本分类研究

被引:11
作者
李钰曼
陈志泊
许福
机构
[1] 北京林业大学信息学院
关键词
文本分类; 关键词抽取; 注意力机制; 胶囊网络; 类别标签表示;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
【目的】通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果。【方法】改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验。【结果】KACC模型有效提高了数据质量;实验结果表明,KACC模型在准确率、召回率、F值三方面均优于现有模型,分类准确率达97.4%。【局限】实验数据规模受限,未对类别区分度在其他语料上的代表性进行探究。【结论】KACC模型在文本分类方面与现有分类方法相比具有更好的分类效率和效果。
引用
收藏
页码:89 / 97
页数:9
相关论文
共 14 条
[1]
一种基于属性加权补集的朴素贝叶斯文本分类算法 [J].
陈凯 ;
黄英来 ;
高文韬 ;
赵鹏 .
哈尔滨理工大学学报, 2018, 23 (04) :69-74
[2]
基于卷积神经网络的中文财经新闻分类方法 [J].
谢志峰 ;
吴佳萍 ;
马利庄 .
山东大学学报(工学版), 2018, 48 (03) :34-39+66
[3]
关联语义结合卷积神经网络的文本分类方法 [J].
魏勇 .
控制工程, 2018, 25 (02) :367-370
[4]
基于短语注意机制的文本分类 [J].
江伟 ;
金忠 .
中文信息学报, 2018, 32 (02) :102-109+119
[5]
结合注意力机制的长文本分类方法 [J].
卢玲 ;
杨武 ;
王远伦 ;
雷子鉴 ;
李莹 .
计算机应用, 2018, 38 (05) :1272-1277
[6]
面向文本分类的有监督显式语义表示 [J].
孙飞 ;
郭嘉丰 ;
兰艳艳 ;
程学旗 .
数据采集与处理, 2017, 32 (03) :550-558
[7]
基于LDA模型的文本分类研究 [J].
姚全珠 ;
宋志理 ;
彭程 .
计算机工程与应用 , 2011, (13) :150-153
[8]
基于统计与协同过滤的关键词提取研究[D] 李华灿 西安电子科技大学 2015,
[9]
基于改进的TFIDF关键词自动提取算法研究 [D]. 
杨凯艳 .
湘潭大学,
2015
[10]
基于词跨度的中文文本关键词提取及在文本分类中的应用 [D]. 
谢晋 .
浙江工业大学,
2011