基于动词次范畴化的汉语句法分析后处理方法的研究

被引:0
作者
王金勇
机构
[1] 黑龙江大学
关键词
动词次范畴化; 汉语句法分析后处理; 句法分析;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
句法分析是自然语言处理的一个基本问题,其主要任务是判断输入的单词序列能不能构成合乎语法的句子,构造出合乎语法的句子的句法结构,也就是应用语法规则或其它知识,依据该输入句子中单词之间的线性次序,得出一个非线性的数据结构。它有很多应用,比如机器翻译、信息获取、自动文摘等都有着重要的作用。 在基于统计的句法分析方法中,最关键的两个问题是建立消解语言歧义统计模型和句法分析后处理的设计,它们决定着句法分析系统的分析正确率和效率。本文从事的工作则主要从句法分析后处理方面入手,提出了一个基于动词次范畴化的汉语句法分析后处理的方法,主要研究工作如下: 1.研究现有常用的统计句法分析模型和句法分析算法,并对其进行综合分析比较,而且解释了动词次范畴化句法模式的理论、形式化描写以及次范畴化和对应的句法树之间的关系。 2.用统计句法分析模型产生n-best句法分析树输出,通过用基于转移的错误驱动的学习方法来进行一步改善动词次范畴化的提取,进行相应的重排序来寻找最优的句法分析树,并进行了相应的基于动词次范畴化规则方法的句法分析后处理实验。 3.通过用基于转移的错误驱动的学习方法来进行一步改善动词次范畴化的提取,达到改善句法分析的最优解,并进行了基于动词次范畴化统计信息方法的句法分析后处理实验。 本文的实验采用了中文信息学会CIPS-ParsEval-2009竞赛语料作为训练语料,它来自于清华汉语语料库(TCT),并用中文信息学会CIPS-ParsEval-2009测试数据进行实验。实验表明本文最好的结果F1值达到88.759%接近中文信息学会句法分析CIPS-ParsEval-2009最好结果F1值88.77%,有利的证明本文的基于动词次范畴化的汉语句法分析后处理方法具有较高的句法分析效率和正确率。
引用
收藏
页数:78
共 15 条
[1]
动词次范畴化形式描写的语义与句法 [J].
韩习武 .
语言文字应用, 2008, (04) :126-132
[2]
词汇—函项语法附视频 [J].
徐烈炯 .
国外语言学, 1990, (01) :34-38
[3]
Learning to Parse Natural Language with Maximum Entropy Models.[J].Adwait Ratnaparkhi.Machine Learning.1999, 1
[4]
Induction of decision trees.[J].J. R. Quinlan.Machine Learning.1986, 1
[5]
“格”辨.[M].(美)C.J.菲尔墨(C.J.Fillmore)著;胡明扬译;.商务印书馆.2002,
[6]
计算语言学.[M].刘颖编著;.清华大学出版社.2002,
[7]
现代汉语动词语义计算理论.[M].靳光瑾著;.北京大学出版社.2001,
[8]
现代语言学词典.[M].(英)戴维·克里斯特尔(DavidCrystal)编;沈家煊译;.商务印书馆.2000,
[9]
现代语言学流派.[M].冯志伟编著;.陕西人民出版社.1999,
[10]
国外语言学概述-流派和代表人物.[M].赵世开主编;.北京语言学院出版社.1990,