微博突发话题检测方法研究

被引:12
作者
邱云飞 [1 ]
程亮 [2 ]
机构
[1] 辽宁工程技术大学软件学院
[2] 辽宁工程技术大学电子与信息工程学院
关键词
微博; 突发话题; 滑动窗口; 语义相似度; 空间向量模型; 话题检测与跟踪;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息。为此,提出一种基于动态滑动窗口的微博突发话题检测方法。利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频-反文档频率函数计算特征权重,构建结合语义的空间向量模型,使用Single-Pass聚类算法思想对其加以改进,生成最终聚类。实验结果表明,该算法能获得较准确的突发话题检测结果。
引用
收藏
页码:288 / 290
页数:3
相关论文
共 2 条
[1]   结合语义的特征权重计算方法研究 [J].
任姚鹏 ;
陈立潮 ;
张英俊 ;
袁英 .
计算机工程与设计, 2010, 31 (10) :2381-2383+2387
[2]   基于滑动窗口的资源可控流量测量算法 [J].
张震 ;
汪斌强 ;
陈庶樵 ;
周粳迪 .
计算机工程, 2010, 36 (03) :122-124