基于LDA主题模型的标签传递算法

被引:13
作者
刘培奇
孙捷焓
机构
[1] 西安建筑科技大学信息与控制工程学院
关键词
LDA主题模型; 标签传递算法; 半监督学习; 数据降维; 流行假设;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。
引用
收藏
页码:403 / 406+410 +410
页数:5
相关论文
共 4 条
[1]
Text classification from labeled and unlabeled documents using EM [J].
Nigam, K ;
McCallum, AK ;
Thrun, S ;
Mitchell, T .
MACHINE LEARNING, 2000, 39 (2-3) :103-134
[2]
一种针对弱标记的直推式多标记分类方法 [J].
孔祥南 ;
黎铭 ;
姜远 ;
周志华 .
计算机研究与发展, 2010, (08) :1392-1399
[3]
基于KL距离的非平衡数据半监督学习算法 [J].
许震 ;
沙朝锋 ;
王晓玲 ;
周傲英 .
计算机研究与发展, 2010, 47 (01) :81-87
[4]
基于LDA模型的文本分割 [J].
石晶 ;
胡明 ;
石鑫 ;
戴国忠 .
计算机学报, 2008, (10) :1865-1873