学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于KACC模型的文本分类研究
被引:11
作者
:
论文数:
引用数:
h-index:
机构:
李钰曼
论文数:
引用数:
h-index:
机构:
陈志泊
论文数:
引用数:
h-index:
机构:
许福
机构
:
[1]
北京林业大学信息学院
来源
:
数据分析与知识发现
|
2019年
/ 10期
关键词
:
文本分类;
关键词抽取;
注意力机制;
胶囊网络;
类别标签表示;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
【目的】通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果。【方法】改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验。【结果】KACC模型有效提高了数据质量;实验结果表明,KACC模型在准确率、召回率、F值三方面均优于现有模型,分类准确率达97.4%。【局限】实验数据规模受限,未对类别区分度在其他语料上的代表性进行探究。【结论】KACC模型在文本分类方面与现有分类方法相比具有更好的分类效率和效果。
引用
收藏
页码:89 / 97
页数:9
相关论文
共 14 条
[1]
一种基于属性加权补集的朴素贝叶斯文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
陈凯
;
论文数:
引用数:
h-index:
机构:
黄英来
;
论文数:
引用数:
h-index:
机构:
高文韬
;
论文数:
引用数:
h-index:
机构:
赵鹏
.
哈尔滨理工大学学报,
2018,
23
(04)
:69
-74
[2]
基于卷积神经网络的中文财经新闻分类方法
[J].
论文数:
引用数:
h-index:
机构:
谢志峰
;
论文数:
引用数:
h-index:
机构:
吴佳萍
;
论文数:
引用数:
h-index:
机构:
马利庄
.
山东大学学报(工学版),
2018,
48
(03)
:34
-39+66
[3]
关联语义结合卷积神经网络的文本分类方法
[J].
魏勇
论文数:
0
引用数:
0
h-index:
0
机构:
河南工学院计算机科学与技术系
魏勇
.
控制工程,
2018,
25
(02)
:367
-370
[4]
基于短语注意机制的文本分类
[J].
论文数:
引用数:
h-index:
机构:
江伟
;
论文数:
引用数:
h-index:
机构:
金忠
.
中文信息学报,
2018,
32
(02)
:102
-109+119
[5]
结合注意力机制的长文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
卢玲
;
论文数:
引用数:
h-index:
机构:
杨武
;
论文数:
引用数:
h-index:
机构:
王远伦
;
论文数:
引用数:
h-index:
机构:
雷子鉴
;
论文数:
引用数:
h-index:
机构:
李莹
.
计算机应用,
2018,
38
(05)
:1272
-1277
[6]
面向文本分类的有监督显式语义表示
[J].
论文数:
引用数:
h-index:
机构:
孙飞
;
论文数:
引用数:
h-index:
机构:
郭嘉丰
;
论文数:
引用数:
h-index:
机构:
兰艳艳
;
论文数:
引用数:
h-index:
机构:
程学旗
.
数据采集与处理,
2017,
32
(03)
:550
-558
[7]
基于LDA模型的文本分类研究
[J].
论文数:
引用数:
h-index:
机构:
姚全珠
;
论文数:
引用数:
h-index:
机构:
宋志理
;
论文数:
引用数:
h-index:
机构:
彭程
.
计算机工程与应用 ,
2011,
(13)
:150
-153
[8]
基于统计与协同过滤的关键词提取研究[D] 李华灿 西安电子科技大学 2015,
[9]
基于改进的TFIDF关键词自动提取算法研究
[D].
杨凯艳
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学
湘潭大学
杨凯艳
.
湘潭大学,
2015
[10]
基于词跨度的中文文本关键词提取及在文本分类中的应用
[D].
论文数:
引用数:
h-index:
机构:
谢晋
.
浙江工业大学,
2011
←
1
2
→
共 14 条
[1]
一种基于属性加权补集的朴素贝叶斯文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
陈凯
;
论文数:
引用数:
h-index:
机构:
黄英来
;
论文数:
引用数:
h-index:
机构:
高文韬
;
论文数:
引用数:
h-index:
机构:
赵鹏
.
哈尔滨理工大学学报,
2018,
23
(04)
:69
-74
[2]
基于卷积神经网络的中文财经新闻分类方法
[J].
论文数:
引用数:
h-index:
机构:
谢志峰
;
论文数:
引用数:
h-index:
机构:
吴佳萍
;
论文数:
引用数:
h-index:
机构:
马利庄
.
山东大学学报(工学版),
2018,
48
(03)
:34
-39+66
[3]
关联语义结合卷积神经网络的文本分类方法
[J].
魏勇
论文数:
0
引用数:
0
h-index:
0
机构:
河南工学院计算机科学与技术系
魏勇
.
控制工程,
2018,
25
(02)
:367
-370
[4]
基于短语注意机制的文本分类
[J].
论文数:
引用数:
h-index:
机构:
江伟
;
论文数:
引用数:
h-index:
机构:
金忠
.
中文信息学报,
2018,
32
(02)
:102
-109+119
[5]
结合注意力机制的长文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
卢玲
;
论文数:
引用数:
h-index:
机构:
杨武
;
论文数:
引用数:
h-index:
机构:
王远伦
;
论文数:
引用数:
h-index:
机构:
雷子鉴
;
论文数:
引用数:
h-index:
机构:
李莹
.
计算机应用,
2018,
38
(05)
:1272
-1277
[6]
面向文本分类的有监督显式语义表示
[J].
论文数:
引用数:
h-index:
机构:
孙飞
;
论文数:
引用数:
h-index:
机构:
郭嘉丰
;
论文数:
引用数:
h-index:
机构:
兰艳艳
;
论文数:
引用数:
h-index:
机构:
程学旗
.
数据采集与处理,
2017,
32
(03)
:550
-558
[7]
基于LDA模型的文本分类研究
[J].
论文数:
引用数:
h-index:
机构:
姚全珠
;
论文数:
引用数:
h-index:
机构:
宋志理
;
论文数:
引用数:
h-index:
机构:
彭程
.
计算机工程与应用 ,
2011,
(13)
:150
-153
[8]
基于统计与协同过滤的关键词提取研究[D] 李华灿 西安电子科技大学 2015,
[9]
基于改进的TFIDF关键词自动提取算法研究
[D].
杨凯艳
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学
湘潭大学
杨凯艳
.
湘潭大学,
2015
[10]
基于词跨度的中文文本关键词提取及在文本分类中的应用
[D].
论文数:
引用数:
h-index:
机构:
谢晋
.
浙江工业大学,
2011
←
1
2
→