稀疏自动编码器在文本分类中的应用研究

被引:50
作者
秦胜君
卢志平
机构
[1] 广西科技大学管理学院
关键词
文本分类; 深度学习; 稀疏自动编码器; 深度置信网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集。如果训练集的数据量较大,则容易出现特征项不明确、特征信息丢失等缺陷。为解决上述问题,提出运用"深度学习"中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类。实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机;但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率。
引用
收藏
页码:9422 / 9426
页数:5
相关论文
共 7 条
[1]
基于演化超网络的中文文本分类方法 [J].
王进 ;
金理雄 ;
孙开伟 .
江苏大学学报(自然科学版), 2013, 34 (02) :196-201
[2]
基于SVM算法的文本分类技术研究 [J].
崔建明 ;
刘建明 ;
廖周宇 .
计算机仿真, 2013, 30 (02) :299-302+368
[3]
基于支持向量的迭代修正质心文本分类算法 [J].
王德庆 ;
张辉 .
北京航空航天大学学报, 2013, (02) :269-274
[4]
改进的最大熵权值算法在文本分类中的应用 [J].
李学相 .
计算机科学, 2012, 39 (06) :210-212
[5]
结合聚类思想神经网络文本分类技术研究 [J].
朱云霞 .
计算机应用研究, 2012, 29 (01) :155-157
[6]
文本分类中特征选择方法的比较与改进 [J].
单丽莉 ;
刘秉权 ;
孙承杰 .
哈尔滨工业大学学报, 2011, 43(S1) (S1) :319-324
[7]
Learning multiple layers of representation.[J].Geoffrey E. Hinton.Trends in Cognitive Sciences.2007, 10