汉语基本短语的自动识别

被引:43
作者
张昱琪
周强
机构
[1] 智能技术与系统国家重点实验室
关键词
部分分析; 基本短语; 基于实例学习; 短语结构; 词汇排歧;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文应用基于实例的MBL(Memory BasedLearning)学习方法 ,对汉语中较常见的 9种基本短语的边界及类别进行识别 ,并利用短语内部构成结构和词汇信息对预测中出现的边界歧义和短语类型歧义进行了排歧处理。实验中还比较了在特征向量中加入词汇信息与否对实验结果的影响。实验取得了比较令人满意的结果 :对这 9种基本短语的识别正确率达到 95 .2 % ;召回率达到 93.7%。
引用
收藏
页码:1 / 8
页数:8
相关论文
共 1 条
  • [1] Fast np chunking using memory-based learning techniques .2 J. B. Veenstra. . 1998