统计与规则并举的汉语句法分析模型

被引：9

作者：

周明，黄昌宁，张敏，白栓虎，吴升

机构：

[1] 清华大学计算机科学与技术系，电子工业部计算机与微电子研究与发展中心

来源：

计算机研究与发展 | 1994年 / 02期

关键词：

汉语句法分析，语料库，统计模型，知识获取;

D O I：

暂无

中图分类号：

TP391.2 [翻译机];

学科分类号：

081203 ; 0835 ;

摘要：

在自然语言分析中，传统的基于规则的方法和近年兴起的基于统计的方法各有利弊，如何把二者有机的结合起来，以提高分析器的处理能力，是当前计算语言学的重要课题。本文采用依存文法，提出了一种基于依存文法的融合语料库、规则方法和统计方法的汉语分析模型ＣＲＳＰ（Ｃｏｒｐｕｓ，ＲｕｌｅａｎｄＳｔａｔｉｓｔｉｃｓｂａｓｅｄＰａｒｓｅｒ）。该模型的特点是将汉语依存文法分析看作是与词性标注过程等价的一个基于统计的标注过程。文中首先介绍了ＣＲＳＰ的设计思想，然后讨论了从标注过的语料中获取知识的方法，叙述了用于词性标注和依存关系标注的统计模型。试验表明这种模型具有很大的优越性。

引用

页码：40 / 49

页数：10