基于Chart算法的维吾尔语句法分析系统的设计与实现

被引:0
作者
哈里旦木·阿布都克里木
机构
[1] 新疆大学
关键词
句法分析; 标注; 规则库; Chart算法;
D O I
暂无
年度学位
2010
学位类型
硕士
摘要
句法分析是自然语言处理中一个很重要的研究内容。对一个语言的分析包括词法分析、句法分析、语义和语用分析几个层面,因此句法分析的好坏直接影响到后继工程的进程。 本论文首先建立了维吾尔语句法树库标注体系,此标注体系包括两个模块:功能语块标记模块和成分标记模块。通过这个标注体系我们对建立了规则库,完成了这些基础工作后,我们分析了国内外正在流行的句法分析方法,从中选择了Chart句法分析方法,一开始采用了自底向上的Chart句法分析方法,但当发现这种方法分析效率比较低,而且容易产生歧义,我们改进了算法,将自底向上和自顶向下的Chart算法结合起来,实现了基于规则的维吾尔语Chart句法分析器。对于该分析器的测试是在新疆大学多语种信息技术自治区重点实验室词性标注语料库(XJU UPOS Corpus)的基础上进行的,测试结果较理想。 在用Chart系统分析的过程中我们发现一些问题,比如:所选取的字典和规则库规模较小,规则库中规则之间常常会发生冲突等。因为我们知道自然语言是存在歧义的,因此产生上述问题也是不可避免的。 今后的工作应该是不断地完善句法树库标注体系,由此提高规则库的准确性,而且应该将规则库的语法规则更加复杂化和完整化,从而提高Chart句法分析体统的效率。
引用
收藏
页数:63
共 18 条
[1]
基于期待类型的Chart句法分析算法 [J].
王燚 ;
李中志 .
计算机应用, 2009, 29 (05) :1251-1253
[2]
汉语自动句法分析的理论与方法 [J].
刘挺 ;
马金山 .
当代语言学, 2009, 11 (02) :100-112+189
[3]
基于改进线图分析算法的浅层汉语句法分析器的设计与实现 [J].
吴江宁 ;
朱国华 .
计算机应用研究, 2007, (09) :164-167
[4]
汉语句法树库标注体系 [J].
周强 .
中文信息学报 , 2004, (04) :1-8
[5]
角色反演算法 [J].
白硕 ;
张浩 .
软件学报, 2003, (03) :328-333
[6]
浅层句法分析方法概述 [J].
孙宏林 ;
俞士汶 .
当代语言学, 2000, (02) :74-83+124
[7]
基于短语结构语法的自动句法分析方法 [J].
冯志伟 .
当代语言学, 2000, (02) :84-98+124
[8]
基于LR算法的汉语句法分析系统 [J].
姚文琳 .
山东轻工业学院学报(自然科学版), 1999, (03) :6-10
[9]
汉语树库的构建 [J].
周强 ;
张伟 ;
俞士汶 .
中文信息学报, 1997, (04)
[10]
汉语短语标注标记集的确定 [J].
周强 ;
俞士汶 .
中文信息学报, 1996, (04)