基于LDA话题演化研究方法综述

被引:86
作者
单斌
李芳
机构
[1] 上海交通大学计算机科学与工程系中德语言技术联合实验室
关键词
话题模型; 话题演化; Latent Dirichlet Allocation;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
现实生活中不断有新话题的产生和旧话题的衰减,同时话题的内容也会随着时间发生变化。自动探测话题随时间的演化越来越受到人们的关注。Latent Dirichlet Allocation模型是近年提出的概率话题模型,已经在话题演化领域得到较为广泛的应用。该文提出了话题演化的两个方面:内容演化和强度演化,总结了基于LDA话题模型的话题演化方法,根据引入时间的不同方式将目前的研究方法分为三类:将时间信息结合到LDA模型、对文本集合后离散和先离散方法。在详细叙述这三种方法的基础上,针对时间粒度、是否在线等多个特征进行了对比,并且简要描述了目前广泛应用的话题演化评测方法。文章最后分析了目前存在的挑战,并且对该研究方向进行了展望。
引用
收藏
页码:43 / 49+68 +68
页数:8
相关论文
共 2 条