基于触发词指导的自相似度聚类事件检测

被引:12
作者
张先飞 [1 ]
郭志刚 [1 ]
刘嵩 [1 ]
程磊 [2 ]
田雨暄 [1 ]
机构
[1] 解放军信息工程大学信息工程学院
[2] 中国人民解放军部队
关键词
事件检测; 触发词; 自相似度; 命名实体; 聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
传统方法将事件检测任务看作分类问题,将词作为实例来训练分类器,容易导致训练正反例不平衡,同时,在语料库规模较小时存在一定的数据稀疏问题。首先避开以词为实例进行分类,在事件类别判断上引入聚类思想,在事件触发词的指导下,采用自相似度对K-means聚类算法中的K值进行自收敛,优化了聚类算法。然后结合命名实体及其位置信息,对事件类别进行详细定位,很好地解决了传统事件检测对类别模板的依赖性,所检测的事件在文本摘要、检索和主题检测与追踪上得到了很好的应用。
引用
收藏
页码:212 / 214+220 +220
页数:4
相关论文
共 2 条
  • [1] 中文事件抽取技术研究
    赵妍妍
    秦兵
    车万翔
    刘挺
    [J]. 中文信息学报, 2008, (01) : 3 - 8
  • [2] Infrastructure for open-domain information extraction. Mihai Surdeanu,Sanda Harabagiu. Proceedings of the Human Language Technology Conference . 2002