基于爆发词识别的微博突发事件监测方法研究

被引:17
作者
陈国兰 [1 ,2 ]
机构
[1] 南京邮电大学图书馆
[2] 南京邮电大学科技情报研究所
关键词
微博; 爆发词; 共现分析; 突发事件;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突发事件。最后以新浪微博数据为例进行实验,验证了提出的算法对突发事件监测能取得不错的效果。
引用
收藏
页码:123 / 128
页数:6
相关论文
共 12 条
[1]   基于突发词聚类的微博突发事件检测方法 [J].
郭跇秀 ;
吕学强 ;
李卓 .
计算机应用, 2014, 34 (02) :486-490+505
[2]   基于微博舆情监测的K-Means算法改进研究 [J].
朱晓峰 ;
陈楚楚 ;
尹婵娟 .
情报理论与实践, 2014, 37 (01) :136-140
[3]   基于CRFs的领域爆发词识别的研究与实现 [J].
逯万辉 ;
马建霞 .
情报科学, 2014, 32 (01) :89-93
[4]   基于时间特性的微博热门话题检测算法研究 [J].
闫光辉 ;
赵红运 ;
任亚缙 ;
陈勇 .
计算机应用研究, 2014, 31 (01) :43-46
[5]   中文微博突发事件检测研究 [J].
王勇 ;
肖诗斌 ;
郭跇秀 ;
吕学强 .
现代图书情报技术, 2013, (02) :57-62
[6]   一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法 [J].
王琳 ;
冯时 ;
徐伟丽 ;
杨卓 ;
王大玲 ;
张一飞 .
计算机应用与软件, 2012, 29 (08) :25-29+94
[7]   爆发词识别与主题探测技术研究综述 [J].
逯万辉 ;
马建霞 ;
赵迎光 .
情报理论与实践, 2012, 35 (06) :125-128
[8]   基于隐主题分析和文本聚类的微博客中新闻话题的发现 [J].
路荣 ;
项亮 ;
刘明荣 ;
杨青 .
模式识别与人工智能, 2012, 25 (03) :382-387
[9]   突发事件热点话题识别系统及关键问题研究 [J].
陈莉萍 ;
杜军平 .
计算机工程与应用, 2011, 47 (32) :19-22
[10]   基于共词分析的文本主题词聚类与主题发现 [J].
王小华 ;
徐宁 ;
谌志群 .
情报科学, 2011, 29 (11) :1621-1624