基于时间分布特征的博客突发事件检测

被引:9
作者
林达真
李绍滋
曹冬林
机构
[1] 厦门大学智能科学与技术系
[2] 厦门大学福建省仿脑系统重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
时间分布特征; KL距离; 时间信息明确的事件; 时间信息有歧义的事件;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
博客是目前网络舆论的重要载体之一,如何自动检测博客中的突发事件对于舆情分析与疏导具有重要的研究价值。针对目前突发事件检测中存在的时间信息有歧义的虚假突发事件问题,本文提出了一种基于时间分布特征的博客突发事件检测方法。该方法通过波峰检测和计算事件文档与背景语料文档之间、事件相关文档和不相关文档之间的时间分布差异来判断该事件在时间特征上是否具有突发性和关联性。实验结果表明,该方法可有效检测博客中的突发事件并可有效去除时间信息有歧义的虚假突发事件。
引用
收藏
页码:145 / 149
页数:5
相关论文
共 4 条
  • [1] AC和FKP融合算法在民族突发事件聚类分析中的应用
    云健
    刘勇奎
    陈华
    于洪志
    [J]. 华中科技大学学报(社会科学版), 2009, 23 (01) : 117 - 121
  • [2] 突发事件信息提取研究.[D].杨尔弘.北京语言大学.2005, 05
  • [3] Temporal profiles of queries
    Jones, Rosie
    Diaz, Fernando
    [J]. ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2007, 25 (03)
  • [4] Information diffusion through blogspace.[J].D. Gruhl;David Liben-Nowell;R. Guha;A. Tomkins.ACM SIGKDD Explorations Newsletter.2004, 2