学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于LDA主题模型的标签传递算法
被引:13
作者
:
论文数:
引用数:
h-index:
机构:
刘培奇
论文数:
引用数:
h-index:
机构:
孙捷焓
机构
:
[1]
西安建筑科技大学信息与控制工程学院
来源
:
计算机应用
|
2012年
/ 32卷
/ 02期
关键词
:
LDA主题模型;
标签传递算法;
半监督学习;
数据降维;
流行假设;
D O I
:
暂无
中图分类号
:
TP18 [人工智能理论];
学科分类号
:
140502
[人工智能]
;
摘要
:
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。
引用
收藏
页码:403 / 406+410 +410
页数:5
相关论文
共 4 条
[1]
Text classification from labeled and unlabeled documents using EM
[J].
Nigam, K
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Nigam, K
;
McCallum, AK
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
McCallum, AK
;
Thrun, S
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Thrun, S
;
Mitchell, T
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Mitchell, T
.
MACHINE LEARNING,
2000,
39
(2-3)
:103
-134
[2]
一种针对弱标记的直推式多标记分类方法
[J].
论文数:
引用数:
h-index:
机构:
孔祥南
;
论文数:
引用数:
h-index:
机构:
黎铭
;
论文数:
引用数:
h-index:
机构:
姜远
;
论文数:
引用数:
h-index:
机构:
周志华
.
计算机研究与发展,
2010,
(08)
:1392
-1399
[3]
基于KL距离的非平衡数据半监督学习算法
[J].
论文数:
引用数:
h-index:
机构:
许震
;
论文数:
引用数:
h-index:
机构:
沙朝锋
;
论文数:
引用数:
h-index:
机构:
王晓玲
;
论文数:
引用数:
h-index:
机构:
周傲英
.
计算机研究与发展,
2010,
47
(01)
:81
-87
[4]
基于LDA模型的文本分割
[J].
论文数:
引用数:
h-index:
机构:
石晶
;
论文数:
引用数:
h-index:
机构:
胡明
;
论文数:
引用数:
h-index:
机构:
石鑫
;
论文数:
引用数:
h-index:
机构:
戴国忠
.
计算机学报,
2008,
(10)
:1865
-1873
←
1
→
共 4 条
[1]
Text classification from labeled and unlabeled documents using EM
[J].
Nigam, K
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Nigam, K
;
McCallum, AK
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
McCallum, AK
;
Thrun, S
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Thrun, S
;
Mitchell, T
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon Univ, Sch Comp Sci, Pittsburgh, PA 15213 USA
Mitchell, T
.
MACHINE LEARNING,
2000,
39
(2-3)
:103
-134
[2]
一种针对弱标记的直推式多标记分类方法
[J].
论文数:
引用数:
h-index:
机构:
孔祥南
;
论文数:
引用数:
h-index:
机构:
黎铭
;
论文数:
引用数:
h-index:
机构:
姜远
;
论文数:
引用数:
h-index:
机构:
周志华
.
计算机研究与发展,
2010,
(08)
:1392
-1399
[3]
基于KL距离的非平衡数据半监督学习算法
[J].
论文数:
引用数:
h-index:
机构:
许震
;
论文数:
引用数:
h-index:
机构:
沙朝锋
;
论文数:
引用数:
h-index:
机构:
王晓玲
;
论文数:
引用数:
h-index:
机构:
周傲英
.
计算机研究与发展,
2010,
47
(01)
:81
-87
[4]
基于LDA模型的文本分割
[J].
论文数:
引用数:
h-index:
机构:
石晶
;
论文数:
引用数:
h-index:
机构:
胡明
;
论文数:
引用数:
h-index:
机构:
石鑫
;
论文数:
引用数:
h-index:
机构:
戴国忠
.
计算机学报,
2008,
(10)
:1865
-1873
←
1
→