基于速度增长的微博热点话题发现

被引:16
作者
薛素芝 [1 ,2 ]
鲁燃 [1 ,2 ]
任圆圆 [1 ,2 ]
机构
[1] 山东师范大学信息科学与工程学院
[2] 山东省分布式计算机软件新技术重点实验室
关键词
增长斜率; 增长速度; 时间二元组序列; 热点发现;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
在微博热点话题发现中,由于微博文本短、词量少、用词不规范等特征,使得传统的热点话题检测方法力不从心。针对这一问题,提出了基于速度增长的微博热点话题发现方法。首先把经过预处理的微博按等数量窗口划分,统计每个窗口内各词语的词频,并表示成时间二元组序列;然后通过计算每相邻两个窗口的个词语的增长斜率来发现增长速度快的词语;再通过计算与该词语有关的用户的增长速度和微博条数的增长速度来确定该词语是否是热点主题词;最后通过热点主题词聚类产生热点话题。通过实验验证了该方法的可行性。实验结果表明,该方法在一定程度上提高了检测效率,降低了漏检率和误检率,可以有效地及时发现微博热点话题。
引用
收藏
页码:2598 / 2601
页数:4
相关论文
共 4 条
[1]  
中文微博客热点话题检测与跟踪技术研究.[D].孙胜平.北京交通大学.2011, 09
[2]  
微博客热点话题发现策略研究.[D].杨冠超.浙江大学.2011, 07
[3]   一种中文微博新闻话题检测的方法 [J].
郑斐然 ;
苗夺谦 ;
张志飞 ;
高灿 .
计算机科学, 2012, 39 (01) :138-141
[4]   引入活跃指数的微博用户排名机制 [J].
石磊 ;
张聪 ;
卫琳 .
小型微型计算机系统, 2012, 33 (01) :110-114