微博客蕴含交通事件信息抽取的自动标注方法

被引:11
作者
仇培元 [1 ,2 ]
张恒才 [1 ]
余丽 [1 ,2 ]
陆锋 [1 ]
机构
[1] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
[2] 中国科学院大学
关键词
微博客; 信息抽取; 交通事件; 条件随机场; 支撑向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
微博客文本蕴含丰富的实时交通事件信息,能够为现有交通信息采集手段提供补充。然而,当前事件抽取方法缺少对地理实体关系的判断过程,对涉及多个地理实体及关系表达的地理空间要素抽取效果不佳,难以准确识别交通事件信息的位置描述。该文提出一种自动标注方法,将地理实体关系识别引入事件抽取过程来解决这一问题。该方法利用条件随机场模型实现交通事件角色标注,利用支撑向量机模型实现角色关系与要素关系标注,完成了交通事件信息空间要素识别。以新浪微博为数据源开展的实验分析表明,该文所提出的微博客蕴含交通事件抽取方法,正确率和召回率均达到90%,优于现有的基于模式匹配的抽取方法。
引用
收藏
页码:107 / 116
页数:10
相关论文
共 23 条
  • [1] Social-based traffic information extraction and classification. Wanichayapong N,Pruthipunyaskul W,PattaraAtikom W,et al. Proceedings of the11th International Conference on ITS Telecommunications(ITST 2011) . 2011
  • [2] A MultiIndicator Approach for Geolocalization of Tweets. Schulz A,Hadjakos A,Paulheim H,et al. Proceedings of the 7th International AAAI Conference on Weblogs and Social Media(ICWSM2013) . 2013
  • [3] SUPPORT-VECTOR NETWORKS
    CORTES, C
    VAPNIK, V
    [J]. MACHINE LEARNING, 1995, 20 (03) : 273 - 297
  • [4] Information extraction from research papers using conditional random fields[J] . Fuchun Peng,Andrew McCallum. &nbspInformation Processing and Management . 2005 (4)
  • [5] Spatial role labeling[J] . Parisa Kordjamshidi,Martijn Van Otterlo,Marie-Francine Moens. &nbspACM Transactions on Speech and Language Processing (TSLP) . 2011 (3)
  • [6] Harvesting Real Time Traffic Information from Twitter[J] . Raymondus Kosala,Erwin Adi,Steven. &nbspProcedia Engineering . 2012
  • [7] 文本挖掘原理[M]. 科学出版社 , 程显毅, 2010
  • [8] 中文文本中事件时空与属性信息解析方法研究[D]. 张春菊.南京师范大学 2013
  • [9] 信息抽取模式自动生成方法的研究
    郑家恒
    王兴义
    李飞
    [J]. 中文信息学报, 2004, (01) : 48 - 54
  • [10] 中文事件抽取技术研究
    赵妍妍
    秦兵
    车万翔
    刘挺
    [J]. 中文信息学报, 2008, (01) : 3 - 8