汉语单句谓语中心词识别知识的获取及应用

被引:15
作者
穗志方 [1 ]
俞士汶 [1 ]
机构
[1] 北京大学计算语言学研究所
关键词
自然语言处理; 语料库; 机器翻译; 知识获取; 谓语中心词; 统计决策树;
D O I
10.13209/j.0479-8023.1998.094
中图分类号
TP391.2, [];
学科分类号
081203 ; 0835 ;
摘要
在基于实例的机器翻译(EBMT)的语句相似度研究中,确定谓语中心词以把握句子的整体结构是至关重要的。以标注了谓语中心词的3000句汉语单句作为训练集,将候选词本身的语法属性以及上下文环境作为该候选词的归类特征,通过建立统计决策树模型获取谓语中心词的识别知识。应用统计决策树进行了谓语中心词的自动识别,并获得了较为满意的测试结果。
引用
收藏
页码:89 / 98
页数:10
相关论文
共 1 条
[1]   现代汉语语法信息词典规格说明书 [J].
俞士汶,朱学锋,王惠,张芸芸 .
中文信息学报, 1996, (02) :1-22