利用LDA的领域新兴主题探测技术综述

被引:37
作者
范云满 [1 ,2 ]
马建霞 [1 ]
机构
[1] 中国科学院国家科学图书馆兰州分馆
[2] 中国科学院大学
关键词
主题模型; LDA; 引文分析; 主题模型可视化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
以LDA为基础,系统梳理新兴主题探测以及主题趋势探测技术中的LDA以及其他LDA改进主题模型的发展现状。介绍LDA的变分推导和Gibbs抽样两种参数推导算法;总结近年来LDA模型的改进,包括对主题演化建模的主题模型、对文档内容和元数据联合建模的模型、采用在线式学习的主题模型及将LDA和引文分析相结合的主题演化方法等,并对不同的改进模型进行深入对比和分析;梳理NIH-VB、TIARA、VxInsight等几种主要的主题模型可视化技术。最后通过对LDA模型的总结分析,探讨利用LDA模型探测领域新兴主题时的关键研究问题。
引用
收藏
页码:58 / 65
页数:8
相关论文
共 8 条
[1]
基于话题模型的科技文献话题发现和趋势分析 [J].
贺亮 ;
李芳 .
中文信息学报, 2012, 26 (02) :109-115
[2]
一种基于密度的自适应最优LDA模型选择方法 [J].
曹娟 ;
张勇东 ;
李锦涛 ;
唐胜 .
计算机学报, 2008, (10) :1780-1787
[3]
基于概率主题模型的文献知识挖掘[J] 王萍; 情报学报 2011,
[4]
Probabilistic topic models[J] David M. Blei Communications of the ACM 2012,
[5]
A Correlated Topic Model of Science[J] The Annals of Applied Statistics 2007,
[6]
Scholarly publishing in the Internet age: a citation analysis of computer science literature[J] Abby A Goodrum;Katherine W McCain;Steve Lawrence;C Lee Giles Information Processing and Management 2001,
[7]
Text Classification from Labeled and Unlabeled Documents using EM.[J] Kamal Nigam;Andrew Kachites Mccallum;Sebastian Thrun;Tom Mitchell Machine Learning 2000,
[8]
An Introduction to Variational Methods for Graphical Models[J] Michael I. Jordan;Zoubin Ghahramani;Tommi S. Jaakkola;Lawrence K. Saul Machine Learning 1999,