共 2 条
微博突发话题检测方法研究
被引:12
作者:
邱云飞
[1
]
程亮
[2
]
机构:
[1] 辽宁工程技术大学软件学院
[2] 辽宁工程技术大学电子与信息工程学院
来源:
关键词:
微博;
突发话题;
滑动窗口;
语义相似度;
空间向量模型;
话题检测与跟踪;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息。为此,提出一种基于动态滑动窗口的微博突发话题检测方法。利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频-反文档频率函数计算特征权重,构建结合语义的空间向量模型,使用Single-Pass聚类算法思想对其加以改进,生成最终聚类。实验结果表明,该算法能获得较准确的突发话题检测结果。
引用
收藏
页码:288 / 290
页数:3
相关论文