稀疏自动编码器在文本分类中的应用研究

被引：50

作者：

秦胜君

卢志平

机构：

[1] 广西科技大学管理学院

来源：

科学技术与工程 | 2013年 / 13卷 / 31期

关键词：

文本分类; 深度学习; 稀疏自动编码器; 深度置信网络;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集。如果训练集的数据量较大,则容易出现特征项不明确、特征信息丢失等缺陷。为解决上述问题,提出运用"深度学习"中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类。实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机;但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率。

引用

页码：9422 / 9426

页数：5

共 7 条

[1]

基于演化超网络的中文文本分类方法 [J].