基于LDA主题模型的标签传递算法

被引：13

作者：

刘培奇

孙捷焓

机构：

[1] 西安建筑科技大学信息与控制工程学院

来源：

计算机应用 | 2012年 / 32卷 / 02期

关键词：

LDA主题模型; 标签传递算法; 半监督学习; 数据降维; 流行假设;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

140502 [人工智能];

摘要：

标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。

引用

页码：403 / 406+410 +410

页数：5

共 4 条

[1]

Text classification from labeled and unlabeled documents using EM [J].