共 1 条
汉语单句谓语中心词识别知识的获取及应用
被引:15
作者:
穗志方
[1
]
俞士汶
[1
]
机构:
[1] 北京大学计算语言学研究所
来源:
关键词:
自然语言处理;
语料库;
机器翻译;
知识获取;
谓语中心词;
统计决策树;
D O I:
10.13209/j.0479-8023.1998.094
中图分类号:
TP391.2, [];
学科分类号:
081203 ;
0835 ;
摘要:
在基于实例的机器翻译(EBMT)的语句相似度研究中,确定谓语中心词以把握句子的整体结构是至关重要的。以标注了谓语中心词的3000句汉语单句作为训练集,将候选词本身的语法属性以及上下文环境作为该候选词的归类特征,通过建立统计决策树模型获取谓语中心词的识别知识。应用统计决策树进行了谓语中心词的自动识别,并获得了较为满意的测试结果。
引用
收藏
页码:89 / 98
页数:10
相关论文