基于时空主题模型的微博主题提取

被引:10
作者
段炼 [1 ,2 ,3 ]
呙维 [1 ]
朱欣焰 [4 ]
胡宝清 [2 ,3 ]
机构
[1] 武汉大学测绘遥感信息工程国家重点实验室
[2] 广西师范学院北部湾环境演变与资源利用教育部重点实验室
[3] 广西师范学院资源环境科学学院
[4] 武汉大学空天信息安全与可信计算教育部重点实验室
关键词
地理主题模型; 微博主题挖掘; 时空分布; 时空推理;
D O I
10.13203/j.whugis20120604
中图分类号
P208 [测绘数据库与信息系统]; TP393.092 [];
学科分类号
070503 ; 081603 ; 0818 ; 081802 ;
摘要
已有地理主题模型没有考虑不同区域对微博主题影响程度的差异性,同时他们将时间要素离散化,难以得到连续时间上的微博主题强度。提出了一种顾及连续时间及区域影响力因素的时空主题模型。该方法将城市划分为多个区域,依据各兴趣点类型及数量对区域赋予权重以表达区域社会功能对微博主题的影响程度,基于稀疏增量式生成模型表达微博主题分布,利用Beta分布描述主题在连续时间中的强度,最终通过Gibbs采样得到时空主题模型各参数。实验表明,本文方法能发现连续时间上微博主题的演变,与已有地理主题模型相比,能更加准确地提取微博主题。
引用
收藏
页码:210 / 213+243 +243
页数:5
相关论文
共 2 条
  • [1] 基于LDA话题演化研究方法综述
    单斌
    李芳
    [J]. 中文信息学报, 2010, (06) : 43 - 49+68
  • [2] Mining geographic knowledge using location aware topic model .2 C. Wang,J. Wang,X. Xie,W.-Y. Ma. Proceedings of the 4th ACM workshop on Geographical information retrieval, GIR’’07 . 2007