基于事件实例驱动的新闻文本事件抽取

被引:12
作者
许旭阳
李弼程
张先飞
韩永峰
机构
[1] 解放军信息工程大学信息工程学院
关键词
事件实例; 分类; 新闻文本; 聚类; 事件抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题。提出了一种基于事件实例驱动的事件抽取方法。首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-medoids算法完成事件抽取。该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性。实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高。
引用
收藏
页码:232 / 235
页数:4
相关论文
共 6 条
  • [1] 基于触发词指导的自相似度聚类事件检测
    张先飞
    郭志刚
    刘嵩
    程磊
    田雨暄
    [J]. 计算机科学, 2010, 37 (03) : 212 - 214+220
  • [2] 中文事件抽取技术研究
    赵妍妍
    秦兵
    车万翔
    刘挺
    [J]. 中文信息学报, 2008, (01) : 3 - 8
  • [3] 中文事件抽取关键技术研究[D]. 谭红叶.哈尔滨工业大学. 2008
  • [4] 基于事件框架的突发事件信息抽取[D]. 冯礼.上海交通大学. 2008
  • [5] 知网 .2 董振东,董强. http://www.keenage.com . 1992
  • [6] The Nature of Statistical Learning Theory .2 Vapnik VN. Springer-Verlag . 2000