基于统计方法的汉语长句依存句法分析

被引:0
作者
王蕾
机构
[1] 中国海洋大学
关键词
依存句法分析; 决策式; 汉语长句; 机器学习;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
句法分析是自然语言处理中的关键性问题之一,它主要研究词和短语如何形成正确的句子,词和短语在句子结构中起什么作用以及它们之间的关系等。句法分析研究领域一直是以短语结构方法为主流,随着句法分析技术的发展,依存语法的优越性逐渐体现,依存句法分析也逐步得到重视。本论文主要采用决策式依存句法分析方法,针对汉语长句的句法分析问题展开研究工作,主要研究内容如下: 首先,对汉语句子做分割的预处理工作,通过构建根搜索器Root-Searcher,找到每个汉语句子的根结点,利用根结点信息将句子分割成两个子句,然后分别分析出两个子句的依存子结构。利用这种分割方法,将长句的分析化为对两个短句的分析,句子的复杂度有所降低,因此,提高了句法分析的正确率,解决了长句句法分析正确率较低的困难。 第二,改进了句子的分析方法,在分析方法上,采用决策式依存句法分析算法,并针对Arc-eager决策式依存句法分析算法所出现的Early-reduce问题,对Meixun Jin的两段式依存句法分析方法做了一定的改进,经过改进后的两段式依存句法分析方法,能够同时解决由动词和介词所引起的Early-reduce问题。 最后,在句子的分析方向上,本论文根据分割后句子的特点,以及汉语语言所具有的投影性特征,提出了采用向前分析和向后分析相结合的策略。相关实验证明,在算法执行过程中,采用两种分析方向相结合的方式,能够显著地提高依存句法分析的正确率。
引用
收藏
页数:68
共 8 条
[1]
自然语言信息抽取中的机器学习方法研究 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
计算机科学, 2005, (03) :186-189+199
[2]
关于自然语言计算机处理的几点思考 [J].
刘海涛 .
术语标准化与信息技术, 2001, (01) :23-27
[3]
语法知识在语言信息处理研究中的作用 [J].
俞士汶 .
语言文字应用, 1997, (04)
[4]
依存语法和机器翻译 [J].
刘海涛 .
语言文字应用, 1997, (03)
[5]
DEPENDENCY STRUCTURES AND TRANSFORMATIONAL RULES [J].
ROBINSON, JJ .
LANGUAGE, 1970, 46 (02) :259-285
[6]
机器翻译原理.[M].赵铁军等编著;.哈尔滨工业大学出版社.2000,
[7]
现代汉语语法信息词典详解.[M].俞士汶等著;.清华大学出版社.1998,
[8]
自然语言的计算机处理.[M].冯志伟著;.上海外语教育出版社.1996,