共 2 条
基于话题标签的微博主题挖掘
被引:10
作者:
李敬
印鉴
刘少鹏
潘雅丽
机构:
[1] 中山大学信息科学与技术学院计算机科学系
来源:
基金:
广东省自然科学基金;
广东省科技计划;
关键词:
主题挖掘;
微博;
社交网络;
话题标签主题模型;
作者主题模型;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
TP393.092 [];
学科分类号:
081203 ;
0835 ;
080402 ;
摘要:
随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使用Gibbs抽样法对模型进行推导,获取微博主题结构。在Twitter数据集上的实验结果表明,与ATM模型和基于潜在狄利克雷分布的微博生成模型相比,HC-ATM模型的主题困惑度更小、差异度更大,并且能有效挖掘出不同微博类型的主题分布。
引用
收藏
页码:30 / 35
页数:6
相关论文