中文事件抽取技术研究

被引:104
作者
赵妍妍
秦兵
车万翔
刘挺
机构
[1] 哈尔滨工业大学计算机学院信息检索研究室
关键词
计算机应用; 中文信息处理; 事件抽取; 事件类别识别; 事件元素识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了基于最大熵的多元分类的方法。这些方法很好的解决了事件抽取中训练实例正反例不平衡以及数据稀疏问题,取得了较好的系统性能。
引用
收藏
页码:3 / 8
页数:6
相关论文
共 4 条
  • [1] 自由文本的信息抽取模式获取的研究[D]. 姜吉发.中国科学院研究生院(计算技术研究所). 2004
  • [2] Using Predicate-Argument Structures for Information Extraction .2 Mihai Surdeanu,Sanda Harabagiu,John Williams,et al. Proceedings of ACL . 2003
  • [3] The Stages of Event Extraction .2 David Ahn. Proceedings of the Workshop on Annotations and Reasoning about Time and Events . 2006
  • [4] Infrastructure for open-domain information extraction .2 Mihai Surdeanu,Sanda Harabagiu. Proceedings of the Human Language Technology Conference . 2002