主题概率模型在微博主题挖掘方面的研究综述

被引:3
作者
陈静
刘琰
王煦中
机构
[1] 信息工程大学
关键词
微博; 主题概率模型; 主题; 主题提取; 社团发现;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
摘要
近年来,微博凭借着自身的特点发展成为社会公共舆论的重要平台,对国家安全和社会发展产生了深远的影响,由此对微博文本主题提取显得格外重要。目前,文本主题挖掘的主流技术是主题概率模型。为此,首先对主题概率模型中LDA模型进行了详细地介绍;其次分析了微博的数据特点,从存在噪音词汇、微博文本短小以及微博的时序性等3个方面综述了主题概率模型在微博主题挖掘方面的研究;近一步又综述了利用主题模型发现基于主题的社团关系的研究;最后总结了未来主题模型在挖掘微博主题方面存在的挑战。
引用
收藏
页码:103 / 110
页数:8
相关论文
共 10 条