规则与统计相结合的汉语依存句法分析技术研究及其应用

被引:0
作者
郎文静
机构
[1] 沈阳航空航天大学
关键词
汉语依存句法分析; 依存方向; 规则; 统计; 模板抽取;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
句法分析是自然语言处理的重要任务之一。依存句法分析是针对给定的句子序列应用某一依存语法对其进行自动分析的一种方法。相对于短语结构语法而言,依存句法分析提供了对句中语法关系层面的简单描述,具有易于理解、便于转化为语义依存形式的优点,可广泛运用于机器翻译、关系抽取、本体构建等领域。本文结合规则与统计的方法,针对汉语依存句法分析的技术及应用进行了探索,主要包括以下内容: 首先,提出了基于最长介词短语的最长名词短语的识别方法,利用了介词短语作状语时与名词短语产生的相互制约特性来进行最长名词短语识别,并采用了新的标记方式及上文长距离关联词作为特征,从而有利于依存树的构建。 其次,本文提出了一种全新的基于依存方向的多阶段统计依存分析方法。该方法将依存分析过程分解为多个子阶段分别进行,各个阶段是一种序贯的模式,因此更利于针对分析过程中的不同问题采取相应的解决方案,同时,前一阶段分析也为后一阶段提供了一个更加清晰的上下文环境。另外,依存方向的引入,使得该方法与经典的基于图的方法相比,具有更低的搜索空间。 再次,将规则与统计方法相结合,利用两者的优点,对汉语依存分析技术进行研究。统计部分使用基于依存方向的多阶段分析方法,规则方法主要体现在词语搭配表的引入及基于统计方法的规则分析技术。实验结果表明,本文方法具有与主流方法可比的分析精度和较高的分析效率。 最后,针对依存分析结果的应用,对模板抽取方法进行探索。提出了基于分句及分句间关系的模板抽取方法,利用分析结果中依存弧和依存关系信息,自动生成模板,为机器翻译、信息检索提供有效的支持。 本文前三部分工作主要在于汉语依存分析的理论与技术上的探索,并为后一部分提供服务,后一部分主要致力于对依存分析的具体应用进行考查。
引用
收藏
页数:67
共 17 条
[1]
音乐领域典型事件抽取技术的研究 [D]. 
宋凡 .
哈尔滨工业大学,
2009
[2]
基于句法分析和机器学习的中文自动问答系统研究 [D]. 
孙昂 .
清华大学,
2007
[3]
依存语法的理论与实践.[M].刘海涛; 著.科学出版社.2009,
[4]
现代汉语语法信息词典详解.[M].俞士汶等著;.清华大学出版社.1998,
[5]
基于双向标注融合的汉语最长短语识别方法 [J].
鉴萍 ;
宗成庆 .
智能系统学报, 2009, 4 (05) :406-413
[6]
句法与词义相结合的中文代词消解 [J].
宋巍 ;
秦兵 ;
郎君 ;
刘挺 .
中文信息学报, 2008, (06) :8-13
[7]
统计和规则相结合的汉语最长名词短语自动识别 [J].
代翠 ;
周俏丽 ;
蔡东风 ;
杨洁 .
中文信息学报, 2008, 22 (06) :110-115
[8]
短语统计机器翻译的句法调序模型 [J].
薛永增 ;
李生 ;
赵铁军 ;
杨沐昀 .
通信学报, 2008, (01) :7-14
[9]
基于条件随机域的复杂最长名词短语识别 [J].
冯冲 ;
陈肇雄 ;
黄河燕 ;
张亮 ;
王江伟 .
小型微型计算机系统, 2006, (06) :1134-1139
[10]
汉语最长名词短语的自动识别 [J].
周强 ;
孙茂松 ;
黄昌宁 .
软件学报, 2000, (02) :195-201