基于句法语义依存分析的中文金融事件抽取

被引:80
作者
万齐智 [1 ,2 ]
万常选 [1 ,2 ]
胡蓉 [3 ,2 ]
刘德喜 [1 ,2 ]
机构
[1] 江西财经大学信息管理学院
[2] 江西财经大学数据与知识工程江西省高校重点实验室
[3] 江西财经大学软件与物联网工程学院
关键词
中文事件抽取; 核心动词链; 句法语义依存分析图; 事件语义关联; 缺省补全;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; F832 [中国金融、银行];
学科分类号
020219 [财政学(含:税收学)]; 120506 [数字人文];
摘要
事件抽取在自然语言处理应用中扮演着重要的角色,如股票市场趋势预测.传统事件抽取较为关注触发词和论元所属类型的正确性,较少地结合应用需求去分析研究事件抽取效果及使用价值.在财经领域,事件作用对象及动作是关注的重点.因此,本文聚焦于金融事件,抽取三元组事件ET(Sub,Pred,Obj).在中文财经新闻中,存在大量事件嵌套和成分共享等现象,致使易出现事件漏抽和事件成分缺失的情况.为了解决这些问题,本文建立一个句法和语义依存分析相结合的中文事件抽取框架,归纳了4种常见缺省结构,并设计相应的补全规则.首先,基于句法依存树,分析动词词法和句法结构,建立核心动词链,使得每个核心动词对应一个事件,解决事件漏抽问题.然后,在句法依存树的基础上添加语义依存关系,建立事件间语义关联,得到句法语义依存分析(Syntactic Semantic Dependency Parsing,SSDP)树.第三,调整SSDP树,优化句法结构,形成SSDP图,使得同等句法结构的词结点处于相同层级,为后续事件抽取提供途径.第四,归纳4种常见缺省结构,设计相应补全规则,解决事件成分缺失问题.最后,在中文财经新闻标题和CoNLL2009中文语料上进行详细的实验测试,实验结果表明该方法是有效的.
引用
收藏
页码:508 / 530
页数:23
相关论文
共 8 条
[1]
基于多任务学习的中文事件抽取联合模型 [J].
贺瑞芳 ;
段绍杨 .
软件学报, 2019, 30 (04) :1015-1030
[2]
基于条件随机场的评价对象缺省项识别 [J].
唐文武 ;
过弋 ;
徐永斌 ;
方旭 .
中文信息学报, 2016, (06) :208-214
[3]
基于语义的中文事件触发词抽取联合模型 [J].
李培峰 ;
周国栋 ;
朱巧明 .
软件学报, 2016, 27 (02) :280-294
[4]
省略界定综述 [J].
钱世凤 .
语文学刊, 2007, (01) :119-122
[5]
统计自然语言处理.[M].宗成庆; 著.清华大学出版社.2013,
[6]
中国现代语法.[M].王力著;.商务印书馆.1985,
[7]
中国文法要略.[M].吕叔湘 著.商务印书馆.1982,
[8]
新著国语文法.[M].黎锦熙编;.商务印书馆.1954,