基于改进BP神经网络的学术活动文本分类

被引:5
作者
田欢 [1 ]
李红莲 [1 ]
吕学强 [2 ]
周建设 [3 ]
夏红科 [4 ]
机构
[1] 北京信息科技大学信息与通信工程学院
[2] 北京信息科技大学网络文化与数字传播北京市重点实验室
[3] 首都师范大学北京成像技术高精尖创新中心
[4] 北京信息科技大学计算机学院
关键词
文本分类; TF-IDF算法; 特征提取; BP神经网络;
D O I
10.16508/j.cnki.11-5866/n.2018.05.008
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
摘要
网站已成为高校发布学术活动通知的主要平台,能否从中准确抽取相关信息并进行分类,直接影响着办公自动化的效率。为了实现文本分类,采用向量空间模型(VSM)描述文本,利用一种改进的TF-IDF算法设置文本向量特征权重,并通过优化的互信息算法来实现文本特征提取与降维,改善了分类模型的向量输入。最后在构造BP神经网络文本分类器时,通过激活函数的选择、参数的初始值设置以及动量因子的引入对其进行改进。实验结果表明,改进后的方法在分类精度上有明显的提高,利用该方法可以较好地进行学术活动的文本分类。
引用
收藏
页码:38 / 44
页数:7
相关论文
共 10 条