基于LSTM算法在新闻分类中的应用

被引:3
作者
朱肖颖
赖绍辉
陆科达
机构
[1] 梧州学院大数据与软件工程学院
关键词
LSTM算法; RNN算法; 深度学习; 文本分类; 模型训练;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP181 [自动推理、机器学习];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
针对传统的RNN算法存在梯度消失的缺陷,在面对海量新闻数据,规模大且分类属性多的情况下存在效率低的问题,该文应用了传统的RNN模型改进后的LSTM神经网络算法,加入了预训练的word2vec模型。首先对新闻数据进行去除停用词及标点、格式转化、分词等预处理;其次进行特征提取、分类模型构造;最后进行了分类模型训练与测试。测试数据表明,在大数据量的情况下,使用LSTM算法具有较高的模型准确度和良好的扩展性。
引用
收藏
页码:10 / 20
页数:11
相关论文
共 6 条
[1]   基于卷积神经网络的中文新闻文本分类 [J].
蓝雯飞 ;
徐蔚 ;
王涛 .
中南民族大学学报(自然科学版), 2018, 37 (01) :138-143
[2]   基于极性转移和LSTM的树结构网络与句子分类 [J].
汪冉 ;
金忠 .
计算机应用研究, 2019, 36 (01) :64-67
[3]   基于LSTM深度学习模型的中国电信官方微博用户情绪分析 [J].
蔡鑫 ;
娄京生 .
电信科学, 2017, 33 (12) :136-141
[4]   深度学习框架下LSTM网络在短期电力负荷预测中的应用 [J].
陈亮 ;
王震 ;
王刚 .
电力信息与通信技术, 2017, 15 (05) :8-11
[5]   基于MapReduce的朴素贝叶斯算法在新闻分类中的应用 [J].
徐保鑫 ;
怀丽波 ;
崔荣一 .
延边大学学报(自然科学版), 2017, 43 (01) :55-59
[6]   基于“中文新闻信息分类与代码”文本分类 [J].
张志平 .
太原理工大学学报, 2010, 41 (04) :402-405+411