主题模型中的参数估计方法综述

被引:16
作者
杜慧
陈云芳
张伟
机构
[1] 南京邮电大学物联网学院
关键词
主题模型; 概率潜在语义分析; 隐含狄利克雷分布; 参数估计;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
主题模型利用快速的机器学习算法从高维稀疏的单词数据中提取出低维的主题表示,实现了对文档单词的聚类。对主题模型中的参数进行估计是该领域的一项重要研究工作。详细描述了概率潜在语义分析模型和潜在狄利克雷模型以及主题模型中基本的参数估计方法,并对模型的困惑度进行了实验比较。
引用
收藏
页码:29 / 32+47 +47
页数:5
相关论文
共 3 条
[1]   混合逆狄利克雷分布的变分学习及应用 [J].
赖裕平 ;
周亚建 ;
丁洪伟 ;
郭玉翠 ;
郭春 ;
杨义先 .
电子学报, 2014, 42 (07) :1435-1440
[2]   自然语言处理中主题模型的发展 [J].
徐戈 ;
王厚峰 .
计算机学报, 2011, 34 (08) :1423-1436
[3]  
Correlated Topic Models .2 Blei D M,Lafferty J D. Advances in Neural Information Pro-cessing Systems . 2006