语言学知识在依存句法分析中的应用研究

被引:0
作者
张丹
机构
[1] 沈阳航空航天大学
关键词
依存句法分析; 语言学知识; 层次成分分析; 动宾关系;
D O I
暂无
年度学位
2017
学位类型
硕士
导师
摘要
句法分析是自然语言处理的一个关键组成部分,依存句法具有表现形式简单易懂、易于标注、解码高效以及更接近语义关系等优势,因此,依存句法分析近年来成为了自然语言处理领域的热点。针对统计依存句法分析还存在着数据稀疏、长距离依存分析准确率低等问题,本文研究将层次分析、句法成分分析、动词语法特点以及动宾搭配等语言学知识引入到依存句法分析过程中。主要工作包括以下内容:第一,针对长距离依存分析准确率低问题,提出了一种引入层次成分分析的句法分析方法。该方法在依存分析之前对句子进行包括核心成分和非核心成分的成分识别,对成分内部和成分之间分别进行依存分析,并且针对不同成分训练不同分析模型。针对CoNLL 2009评测语料,UAS值提升了2.53个百分点,LAS值提升了2.82个百分点。第二,对句法分析结果进行后处理。句法分析结果中存在着动宾关系弧缺失的普遍现象,本文利用语言学知识制定了错误识别规则,该规则能有效地识别依存句法分析结果中缺失动宾关系依存弧的动词,其识别准确率达到了93.80%。本文提出了一种基于约束的解码方法,寻找缺失动宾关系弧的动词的子节点,该过程利用了训练语料构建的动宾搭配库信息。经过后处理UAS值提升了0.21个百分点,动宾关系UAS值提升了2.14个百分点。第三,整合上述提出的两种方法,形成依存句法分析系统。最终系统UAS值提升了2.7个百分点,LAS值提升了2.9个百分点。实验结果表明,将语言学知识应用于依存句法分析中,能够有效地改善其分析效果。
引用
收藏
页数:58
共 26 条
[1]
汉语依存句法分析关键技术研究 [D]. 
李正华 .
哈尔滨工业大学,
2013
[2]
汉英助动词句法比较研究 [D]. 
向二兰 .
华中师范大学,
2011
[3]
统计自然语言处理.[M].宗成庆; 编著.清华大学出版社.2007,
[4]
现代汉语语法信息词典详解.[M].俞士汶等著;.清华大学出版社.2003,
[5]
现代汉语句子.[M].陈昌来著;张斌主编;.华东师范大学出版社.2000,
[6]
面向层次化的汉语功能成分识别研究 [D]. 
赵羿欧 .
哈尔滨工业大学,
2015
[7]
《汉语层次分析录》与句法分析 [D]. 
崔婉星 .
华中科技大学,
2012
[8]
规则与统计相结合的汉语依存句法分析技术研究及其应用 [D]. 
郎文静 .
沈阳航空航天大学,
2012
[9]
基于动词次范畴化的汉语句法分析后处理方法的研究 [D]. 
王金勇 .
黑龙江大学,
2011
[10]
DEPENDENCY STRUCTURES AND TRANSFORMATIONAL RULES [J].
ROBINSON, JJ .
LANGUAGE, 1970, 46 (02) :259-285