中心词驱动的汉语统计句法分析模型的改进

被引:3
作者
何亮 [1 ]
戴新宇 [1 ]
周俊生 [2 ]
陈家骏 [1 ]
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 南京师范大学计算机科学系
关键词
计算机应用; 中文信息处理; 中心词驱动PCFG概率模型; 基本名词短语; N-Best词性序列; 汉语句法分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在对Dan Bikel基于Collins中心词驱动概率句法分析模型实现的句法分析器进行深入研究分析的基础上,对其进行了两个方面的改进。一是通过提供N-best词性候选序列,改进原模型在词性方面的处理,改善了句法分析的结果;二是在该模型中引进单独的基本名词短语识别,从而降低句法分析的复杂度,提高了效率,其中,针对中文的特点,通过对BaseNP的概念进行一系列的扩展,深入研究了基于不同层次概念的BaseNP对句法分析的影响并探讨更适合中文句法分析的BaseNP定义。利用改进的句法分析模型进行中文句法分析实验,实验结果表明,改进模型可以缩短分析时间26%,提高F值4.4个百分点,交叉括号平均减少18%。
引用
收藏
页码:3 / 9
页数:7
相关论文
共 4 条
[1]   汉语基本短语的自动识别 [J].
张昱琪 ;
周强 .
中文信息学报, 2002, (06) :1-8
[2]   统计和规则相结合的汉语组块分析 [J].
李素建 ;
刘群 ;
白硕 .
计算机研究与发展, 2002, (04) :385-391
[3]   汉语基本名词短语结构分析模型 [J].
赵军 ;
黄昌宁 .
计算机学报, 1999, (02) :30-35
[4]  
Head-Driven Statistical Models for Natural Language Parsing .2 M.Collins. The University of Pennsylvania . 1999