基于图和转移算法相结合的中文依存关系解析

被引:0
作者
刘春红
机构
[1] 大连理工大学
关键词
中文依存关系解析; 最大生成树算法; 支持向量机; Nivre算法;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
句法分析是自然语言处理的重要任务之一,近年来得到广泛重视,在机器翻译、信息检索、自动文摘等领域有着直接的应用。依存关系解析是句法分析的一个重要方法,依存关系可以明确地表明词与词之间的句法依存关系,并方便地转化为语意依存描述。词是句子结构中的最小元素,词与词之间的依存关系解析可以表示词间的深层联系,本文在基于词的基础上进行依存关系解析。 目前,英文依存关系解析与日语依存关系解析已经取得了较好的研究成果。中文的语法结构不同于其他语言,依存关系解析较复杂。目前的中文的依存解析方法主要分为两种:基于转移的方法和基于图的方法,基于转移的方法的主要代表方法是Nivre算法,而基于图的主要代表方法是最大生成树解析算法。 Nivre算法是一种确定性的解析方法,基于待解析词对的周边特征进行解析,采用贪婪算法,在每一步都寻求局部最优解,中间结果可以用于随后的解析。最大生成树解析算法是基于整句的依存关系树进行解析,搜索的是全局最优解,最大生成树未解析完毕,不能确定任何中间结果。本文根据Nivre算法和最大生成树解析算法的互补关系提出了两种结合方法。一种是以最大生成树算法为基础,通过Nivre算法结果的存在性修正最大生成树边值的算法,称为基于存在性影响因子的中文依存关系解析;另一个结合方法是以最大生成树算法为基础,通过Nivre算法结果的依存度修正最大生成树边值的算法,称为基于依存度影响因子的中文依存关系解析。 实验采用宾州中文树库5.0,实验结果表明,本文提出的两种结合方法均好于原单一算法。基于依存度影响因子的算法的解析效果最好,精确率达到86.87%。
引用
收藏
页数:63
共 15 条
[1]
基于远距离依存关系的中文依存关系解析 [J].
周惠巍 ;
杨洋 ;
黄德根 .
计算机工程, 2007, (24) :212-214
[2]
基于动作建模的中文依存句法分析 [J].
段湘煜 ;
赵军 ;
徐波 .
中文信息学报, 2007, (05) :25-30
[3]
Using SVM to construct a Chinese dependency parser [J].
Xu Y. ;
Zhang F. .
Journal of Zhejiang University: Science, 2006, 7 (02) :199-203
[4]
机器学习的主要策略综述 [J].
闫友彪 ;
陈元琰 .
计算机应用研究, 2004, (07) :4-10+13
[5]
针对大规模训练集的支持向量机的学习策略 [J].
李红莲 ;
王春花 ;
袁保宗 ;
朱占辉 .
计算机学报, 2004, (05) :715-719
[6]
基于规则的汉语句法分析方法研究 [J].
王鹏 ;
戴新宇 ;
陈家骏 ;
王启祥 .
计算机工程与应用, 2003, (29) :63-66+169
[7]
基于统计的句法分析技术综述 [J].
孟遥 ;
李生 ;
赵铁军 ;
杨沐昀 .
计算机科学, 2003, (09) :54-58
[8]
自然语言句法分析研究现状和发展趋势 [J].
李向宏 ;
王丁 ;
黄成哲 ;
雷国华 .
微处理机, 2003, (02) :4-7+12
[9]
一种汉语语句依存关系网分析策略与生成算法研究 [J].
郭艳华 ;
周昌乐 .
浙江大学学报(理学版), 2000, (06) :637-645
[10]
面向语料库标注的汉语依存体系的探讨 [J].
周明 ;
黄昌宁 .
中文信息学报, 1994, (03)