基于规则匹配的突发事件结果信息抽取研究

被引:17
作者
蒋德良
机构
[1] 浙江大学计算机科学与技术学院
关键词
信息抽取; 规则匹配; 包含关系判断; 信息融合; 结果类型;
D O I
10.16208/j.issn1000-7024.2010.14.031
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为对突发事件的信息提供高质量的检索服务,分析了各种突发性事件报道的结果类别,介绍了各结果类型间可能拥有的包含关系及判断算法,提出了一种能对突发事件结果信息进行准确抽取的方法。该方法首先对突发事件文本按照预定义的规则进行匹配,其次对抽取出来的结果信息节点进行规范化处理,接着按照结果类型包含表,对结果信息节点进行包含关系判断,最后进行信息合并处理并以结构化的形式返回最终取结果。实验结果表明了该方法的有效性。
引用
收藏
页码:3294 / 3297
页数:4
相关论文
共 6 条
[1]   基于时空分析的线索性事件的抽取与集成系统研究 [J].
吴平博 ;
陈群秀 ;
马亮 .
中文信息学报, 2006, (01) :21-28
[2]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[3]  
突发事件信息提取研究[D]. 杨尔弘.北京语言大学. 2005
[4]  
汉语主客观文本分类方法的研究[A]. 姚天昉,彭思崴.第三届全国信息检索与内容安全学术会议论文集[C]. 2007
[5]  
Mastering regular expressions .2 Jeffrey Friedl. O‘Reilly . 2006
[6]  
Learning extraction patterns for subjective expressions .2 Ellen Riloff,Janyce Wiebe. Proceedingsof the Conference on Empirical Methods in Natural Language Processing (EMNLP) . 2003