交集型歧义字段切分方法研究

被引:22
作者
闫引堂
周晓强
机构
[1] 山西大学!太原
关键词
汉语; 自动分词; 汉字切分; 交集型; 歧义; 独立成词能力频次;
D O I
暂无
中图分类号
G254 [文献标引与编目];
学科分类号
摘要
本文通过动态建立独立成词能力频次库的方法以及基于词语 /词性搭配的规则库 ,对交集型歧义字段进行处理 ,大大提高了切分正确率。在 4万语料的开放测试中 ,交集型歧义字段的切分正确率可达 98%以上。
引用
收藏
页码:637 / 643
页数:7
相关论文
共 2 条
  • [1] 高频最大交集型歧义切分字段在汉语自动分词中的作用
    孙茂松
    左正平
    邹嘉彦
    [J]. 中文信息学报, 1999, (01) : 28 - 35
  • [2] 中文文本自动分词和标注[M]. - 商务印书馆 , 刘开瑛著, 2000