汉语单句谓语中心词识别知识的获取及应用

被引：15

作者：

穗志方 ^{[1
]}

俞士汶 ^{[1
]}

机构：

[1] 北京大学计算语言学研究所

来源：

北京大学学报(自然科学版) | 1998年 / Z1期

关键词：

自然语言处理; 语料库; 机器翻译; 知识获取; 谓语中心词; 统计决策树;

D O I：

10.13209/j.0479-8023.1998.094

中图分类号：

TP391.2, [];

学科分类号：

081203 ; 0835 ;

摘要：

在基于实例的机器翻译（ＥＢＭＴ）的语句相似度研究中，确定谓语中心词以把握句子的整体结构是至关重要的。以标注了谓语中心词的３０００句汉语单句作为训练集，将候选词本身的语法属性以及上下文环境作为该候选词的归类特征，通过建立统计决策树模型获取谓语中心词的识别知识。应用统计决策树进行了谓语中心词的自动识别，并获得了较为满意的测试结果。

引用

页码：89 / 98

页数：10