学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
稀疏自动编码器在文本分类中的应用研究
被引:50
作者
:
论文数:
引用数:
h-index:
机构:
秦胜君
论文数:
引用数:
h-index:
机构:
卢志平
机构
:
[1]
广西科技大学管理学院
来源
:
科学技术与工程
|
2013年
/ 13卷
/ 31期
关键词
:
文本分类;
深度学习;
稀疏自动编码器;
深度置信网络;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集。如果训练集的数据量较大,则容易出现特征项不明确、特征信息丢失等缺陷。为解决上述问题,提出运用"深度学习"中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类。实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机;但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率。
引用
收藏
页码:9422 / 9426
页数:5
相关论文
共 7 条
[1]
基于演化超网络的中文文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
王进
;
论文数:
引用数:
h-index:
机构:
金理雄
;
论文数:
引用数:
h-index:
机构:
孙开伟
.
江苏大学学报(自然科学版),
2013,
34
(02)
:196
-201
[2]
基于SVM算法的文本分类技术研究
[J].
论文数:
引用数:
h-index:
机构:
崔建明
;
论文数:
引用数:
h-index:
机构:
刘建明
;
论文数:
引用数:
h-index:
机构:
廖周宇
.
计算机仿真,
2013,
30
(02)
:299
-302+368
[3]
基于支持向量的迭代修正质心文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
王德庆
;
论文数:
引用数:
h-index:
机构:
张辉
.
北京航空航天大学学报,
2013,
(02)
:269
-274
[4]
改进的最大熵权值算法在文本分类中的应用
[J].
论文数:
引用数:
h-index:
机构:
李学相
.
计算机科学,
2012,
39
(06)
:210
-212
[5]
结合聚类思想神经网络文本分类技术研究
[J].
朱云霞
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
南京人口管理干部学院信息科学系
南京大学信息管理系
朱云霞
.
计算机应用研究,
2012,
29
(01)
:155
-157
[6]
文本分类中特征选择方法的比较与改进
[J].
论文数:
引用数:
h-index:
机构:
单丽莉
;
论文数:
引用数:
h-index:
机构:
刘秉权
;
论文数:
引用数:
h-index:
机构:
孙承杰
.
哈尔滨工业大学学报,
2011,
43(S1)
(S1)
:319
-324
[7]
Learning multiple layers of representation.[J].Geoffrey E. Hinton.Trends in Cognitive Sciences.2007, 10
←
1
→
共 7 条
[1]
基于演化超网络的中文文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
王进
;
论文数:
引用数:
h-index:
机构:
金理雄
;
论文数:
引用数:
h-index:
机构:
孙开伟
.
江苏大学学报(自然科学版),
2013,
34
(02)
:196
-201
[2]
基于SVM算法的文本分类技术研究
[J].
论文数:
引用数:
h-index:
机构:
崔建明
;
论文数:
引用数:
h-index:
机构:
刘建明
;
论文数:
引用数:
h-index:
机构:
廖周宇
.
计算机仿真,
2013,
30
(02)
:299
-302+368
[3]
基于支持向量的迭代修正质心文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
王德庆
;
论文数:
引用数:
h-index:
机构:
张辉
.
北京航空航天大学学报,
2013,
(02)
:269
-274
[4]
改进的最大熵权值算法在文本分类中的应用
[J].
论文数:
引用数:
h-index:
机构:
李学相
.
计算机科学,
2012,
39
(06)
:210
-212
[5]
结合聚类思想神经网络文本分类技术研究
[J].
朱云霞
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
南京人口管理干部学院信息科学系
南京大学信息管理系
朱云霞
.
计算机应用研究,
2012,
29
(01)
:155
-157
[6]
文本分类中特征选择方法的比较与改进
[J].
论文数:
引用数:
h-index:
机构:
单丽莉
;
论文数:
引用数:
h-index:
机构:
刘秉权
;
论文数:
引用数:
h-index:
机构:
孙承杰
.
哈尔滨工业大学学报,
2011,
43(S1)
(S1)
:319
-324
[7]
Learning multiple layers of representation.[J].Geoffrey E. Hinton.Trends in Cognitive Sciences.2007, 10
←
1
→