共 12 条
基于爆发词识别的微博突发事件监测方法研究
被引:17
作者:

论文数: 引用数:
h-index:
机构:
机构:
[1] 南京邮电大学图书馆
[2] 南京邮电大学科技情报研究所
来源:
关键词:
微博;
爆发词;
共现分析;
突发事件;
D O I:
暂无
中图分类号:
TP393.092 [];
TP391.1 [文字信息处理];
学科分类号:
080402 ;
081203 ;
0835 ;
摘要:
鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突发事件。最后以新浪微博数据为例进行实验,验证了提出的算法对突发事件监测能取得不错的效果。
引用
收藏
页码:123 / 128
页数:6
相关论文
共 12 条
[1]
基于突发词聚类的微博突发事件检测方法
[J].
郭跇秀
;
吕学强
;
李卓
.
计算机应用,
2014, 34 (02)
:486-490+505

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

李卓
论文数: 0 引用数: 0
h-index: 0
机构: 网络文化与数字传播北京市重点实验室(北京信息科技大学)
[2]
基于微博舆情监测的K-Means算法改进研究
[J].
朱晓峰
;
陈楚楚
;
尹婵娟
.
情报理论与实践,
2014, 37 (01)
:136-140

朱晓峰
论文数: 0 引用数: 0
h-index: 0
机构: 南京工业大学经济与管理学院

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[3]
基于CRFs的领域爆发词识别的研究与实现
[J].
逯万辉
;
马建霞
.
情报科学,
2014, 32 (01)
:89-93

逯万辉
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院国家科学图书馆兰州分馆/中国科学院资源环境科学信息中心
中国科学院研究生院 中国科学院国家科学图书馆兰州分馆/中国科学院资源环境科学信息中心

马建霞
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院国家科学图书馆兰州分馆/中国科学院资源环境科学信息中心 中国科学院国家科学图书馆兰州分馆/中国科学院资源环境科学信息中心
[4]
基于时间特性的微博热门话题检测算法研究
[J].
闫光辉
;
赵红运
;
任亚缙
;
陈勇
.
计算机应用研究,
2014, 31 (01)
:43-46

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[5]
中文微博突发事件检测研究
[J].
王勇
;
肖诗斌
;
郭跇秀
;
吕学强
.
现代图书情报技术,
2013, (02)
:57-62

论文数: 引用数:
h-index:
机构:

肖诗斌
论文数: 0 引用数: 0
h-index: 0
机构:
北京信息科技大学网络文化与数字传播北京市重点实验室
北京拓尔思信息技术股份有限公司 北京信息科技大学网络文化与数字传播北京市重点实验室

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[6]
一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法
[J].
王琳
;
冯时
;
徐伟丽
;
杨卓
;
王大玲
;
张一飞
.
计算机应用与软件,
2012, 29 (08)
:25-29+94

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

王大玲
论文数: 0 引用数: 0
h-index: 0
机构:
东北大学信息科学与工程学院
医学影像计算教育部重点实验室(东北大学) 东北大学信息科学与工程学院

张一飞
论文数: 0 引用数: 0
h-index: 0
机构:
东北大学信息科学与工程学院
医学影像计算教育部重点实验室(东北大学) 东北大学信息科学与工程学院
[7]
爆发词识别与主题探测技术研究综述
[J].
逯万辉
;
马建霞
;
赵迎光
.
情报理论与实践,
2012, 35 (06)
:125-128

逯万辉
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院国家科学图书馆兰州分馆
中国科学院研究生院 中国科学院国家科学图书馆兰州分馆

马建霞
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院国家科学图书馆兰州分馆 中国科学院国家科学图书馆兰州分馆

赵迎光
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学院国家科学图书馆兰州分馆
中国科学院研究生院 中国科学院国家科学图书馆兰州分馆
[8]
基于隐主题分析和文本聚类的微博客中新闻话题的发现
[J].
路荣
;
项亮
;
刘明荣
;
杨青
.
模式识别与人工智能,
2012, 25 (03)
:382-387

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[9]
突发事件热点话题识别系统及关键问题研究
[J].
陈莉萍
;
杜军平
.
计算机工程与应用,
2011, 47 (32)
:19-22

论文数: 引用数:
h-index:
机构:

杜军平
论文数: 0 引用数: 0
h-index: 0
机构: 北京邮电大学计算机学院
[10]
基于共词分析的文本主题词聚类与主题发现
[J].
王小华
;
徐宁
;
谌志群
.
情报科学,
2011, 29 (11)
:1621-1624

王小华
论文数: 0 引用数: 0
h-index: 0
机构: 杭州电子科技大学计算机应用技术研究所

论文数: 引用数:
h-index:
机构:

谌志群
论文数: 0 引用数: 0
h-index: 0
机构: 杭州电子科技大学计算机应用技术研究所