基于话题标签的微博主题挖掘

被引:10
作者
李敬
印鉴
刘少鹏
潘雅丽
机构
[1] 中山大学信息科学与技术学院计算机科学系
基金
广东省自然科学基金; 广东省科技计划;
关键词
主题挖掘; 微博; 社交网络; 话题标签主题模型; 作者主题模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使用Gibbs抽样法对模型进行推导,获取微博主题结构。在Twitter数据集上的实验结果表明,与ATM模型和基于潜在狄利克雷分布的微博生成模型相比,HC-ATM模型的主题困惑度更小、差异度更大,并且能有效挖掘出不同微博类型的主题分布。
引用
收藏
页码:30 / 35
页数:6
相关论文
共 2 条
[1]   基于标签的微博人脉网络挖掘算法和结构分析 [J].
王莎 ;
张连明 .
计算机工程, 2014, 40 (05) :7-11
[2]   基于MB-LDA模型的微博主题挖掘 [J].
张晨逸 ;
孙建伶 ;
丁轶群 .
计算机研究与发展, 2011, (10) :1795-1802