微博中蕴含台风灾害损失信息识别和分类方法

被引:27
作者
杨腾飞 [1 ,2 ]
解吉波 [1 ]
李振宇 [3 ]
李国庆 [1 ]
机构
[1] 中国科学院遥感与数字地球研究所
[2] 中国科学院大学
[3] 山东科技大学
关键词
社交媒体; 台风灾害; 短文本分类; 灾损信息识别; 灾情评估;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
社交媒体在灾害信息的实时发布与传播中发挥着越来越重要的作用。在灾害发生过程中,社交媒体中蕴含的实时灾损信息对灾情及时响应和评估有重要意义。然而,这些涉灾文本具有信息破碎度高、文本特征稀疏、标注语料库匮乏等缺点,使得传统的基于监督学习的方法难以有效提取其中的灾损信息。为此,本文提出了一种通过扩展上下文特征和匹配特征词的方法来快速识别和分类社交媒体中蕴含的不同类别的灾损信息。本方法首先基于中文语法规则,抽取小规模不同灾损类别下微博文本中的涉灾关键词构建特征词搭配对。然后,利用词向量模型和已有词库对这些特征词搭配对进行补充和扩展。同时,根据中文词语共现规则,引入外部语料库优化特征词间的语义搭配关系。最终,以此为基础构建台风灾损分类知识库对灾情文本中蕴含的不同类别灾损信息进行识别和分类。本文以2016年9月15日台风"莫兰蒂"登陆事件作为研究案例,以评估本文方法在灾损信息识别和分类上的效果。结果表明,本文方法对微博文本中蕴含的不同类别风灾损失信息的识别和分类效果显著(各类别综合评价指标都达到了0.74以上)。基于灾损信息分类结果,本文绘制了台风影响的时空分布图,从而进一步说明本文方法在灾害损失评估和减灾救灾方面的效用。
引用
收藏
页码:906 / 917
页数:12
相关论文
共 24 条
  • [1] 反映自然灾害时空分布的社交媒体有效性探讨
    陈梓
    高涛
    罗年学
    赵前胜
    [J]. 测绘科学, 2017, 42 (08) : 44 - 48+129
  • [2] 基于社交媒体信息不同灾害的社会响应特征比较研究
    刘宏波
    翟国方
    [J]. 灾害学, 2017, 32 (01) : 187 - 193
  • [3] 蕴含地理事件微博客消息的自动识别方法
    仇培元
    陆锋
    张恒才
    余丽
    [J]. 地球信息科学学报, 2016, 18 (07) : 886 - 893
  • [4] 面向社交媒体文本的话题检测与追踪技术研究综述
    彭敏
    官宸宇
    朱佳晖
    谢倩倩
    黄佳佳
    黄济民
    杨绍雄
    高望
    应称
    [J]. 武汉大学学报(理学版), 2016, 62 (03) : 197 - 217
  • [5] 基于中文短文本分类的社交媒体灾害事件检测系统研究
    白华
    林勋国
    [J]. 灾害学, 2016, 31 (02) : 19 - 23
  • [6] 基于社交媒体的突发事件应急信息挖掘与分析
    王艳东
    李昊
    王腾
    朱建奇
    [J]. 武汉大学学报(信息科学版) , 2016, (03) : 290 - 297
  • [7] 轨迹数据挖掘城市应用研究综述
    牟乃夏
    张恒才
    陈洁
    张灵先
    戴洪磊
    [J]. 地球信息科学学报, 2015, (10) : 1136 - 1142
  • [8] 基于同义词词林扩展的短文本分类
    王东
    熊世桓
    [J]. 兰州理工大学学报, 2015, 41 (04) : 104 - 108
  • [9] 面向中文文本的事件时空与属性信息解析方法研究
    张春菊
    [J]. 测绘学报, 2015, (05) : 590 - 590
  • [10] Word2vec的核心架构及其应用
    熊富林
    邓怡豪
    唐晓晟
    [J]. 南京师范大学学报(工程技术版), 2015, 15 (01) : 43 - 48