汉语基本名词短语结构分析模型

被引:26
作者
赵军
黄昌宁
机构
[1] 清华大学计算机科学与技术系
[2] 清华大学智能技术与系统国家重点实验室
关键词
自然语言处理; 语料库; 基本名词短语;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文提出了用词语潜在依存关系分析汉语baseNP结构的模型,它有以下的特点:①将依存语法知识融入概率模型中,使得baseNP结构分析在依存语法知识的指导下进行,其性能优于纯粹的概率模型——相邻模型;②词语潜在依存强度的获取算法是基于MDL原则的,在模型建造时既考虑数据拟合性,又考虑模型归纳性,其性能优于基于极大似然原则的词语潜在依存强度获取算法;③词语潜在依存强度获取算法在复杂特征集上进行,可以有效地解决参数估计中的数据稀疏问题.实验结果显示,这个模型对于汉语baseNP结构分析是有效的.
引用
收藏
页码:30 / 35
页数:6
相关论文
empty
未找到相关数据