LDA模型在微博用户推荐中的应用

被引:29
作者
邸亮
杜永萍
机构
[1] 北京工业大学计算机科学与技术学院
基金
北京市自然科学基金;
关键词
主题模型; 潜在狄利克雷分配; 微博; 用户模型; 兴趣分析; 用户推荐;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
摘要
潜在狄利克雷分配(LDA)主题模型可用于识别大规模文档集中潜藏的主题信息,但是对于微博短文本的应用效果并不理想。为此,提出一种基于LDA的微博用户模型,将微博基于用户进行划分,合并每个用户发布的微博以代表用户,标准的文档-主题-词的三层LDA模型变为用户-主题-词的用户模型,利用该模型进行用户推荐。在真实微博数据集上的实验结果表明,与传统的向量空间模型方法相比,采用该方法进行用户推荐具有更好的效果,在选择合适的主题数情况下,其准确率提高近10%。
引用
收藏
页码:1 / 6+11 +11
页数:7
相关论文
共 5 条
  • [1] 基于LDA的中文文本相似度计算
    孙昌年
    郑诚
    夏青松
    [J]. 计算机技术与发展, 2013, 23 (01) : 217 - 220
  • [2] 基于MB-LDA模型的微博主题挖掘
    张晨逸
    孙建伶
    丁轶群
    [J]. 计算机研究与发展, 2011, 48 (10) : 1795 - 1802
  • [3] LDA模型在话题追踪中的应用
    张晓艳
    王挺
    梁晓波
    [J]. 计算机科学, 2011, 38(S1) (S1) : 136 - 139+152
  • [4] Probabilistic Topic Models
    Blei, David M.
    [J]. COMMUNICATIONS OF THE ACM, 2012, 55 (04) : 77 - 84
  • [5] A framework for WWW user activity analysis based on user interest
    Zeng, Jianping
    Zhang, Shiyong
    Wu, Chengrong
    [J]. KNOWLEDGE-BASED SYSTEMS, 2008, 21 (08) : 905 - 910