汉语基本名词短语结构分析模型

被引：26

作者：

赵军

黄昌宁

机构：

[1] 清华大学计算机科学与技术系

[2] 清华大学智能技术与系统国家重点实验室

来源：

计算机学报 | 1999年 / 02期

关键词：

自然语言处理; 语料库; 基本名词短语;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

本文提出了用词语潜在依存关系分析汉语ｂａｓｅＮＰ结构的模型，它有以下的特点：①将依存语法知识融入概率模型中，使得ｂａｓｅＮＰ结构分析在依存语法知识的指导下进行，其性能优于纯粹的概率模型——相邻模型；②词语潜在依存强度的获取算法是基于ＭＤＬ原则的，在模型建造时既考虑数据拟合性，又考虑模型归纳性，其性能优于基于极大似然原则的词语潜在依存强度获取算法；③词语潜在依存强度获取算法在复杂特征集上进行，可以有效地解决参数估计中的数据稀疏问题．实验结果显示，这个模型对于汉语ｂａｓｅＮＰ结构分析是有效的．

引用

页码：30 / 35

页数：6