上下文相关汉语自动分词及词法预处理算法

被引:7
作者
黄河燕
李渝生
机构
[1] 中国科学院计算机语言信息工程研究中心
关键词
汉语自动分词,词法预处理,机器翻译;
D O I
暂无
中图分类号
H085 [机器翻译];
学科分类号
050211 ;
摘要
提出了一种适合于汉英机器翻译的上下文相关汉语自动分词及词法预处理算法.该算法采用正向多路径匹配算法和基于上下文相关知识的歧义切分消解算法,充分利用汉英机译系统词典库中的大量语法和语义等知识进行上下文相关的规则推导消歧,使自动分词的准确率达到了99%以上.同时,该算法还对汉语中意义冗余的重叠词和可以与中心词离合的虚词等进行了词法预处理,从而一方面可以减少系统词典的收词量,另一方面方便于对句子的分析处理
引用
收藏
页码:25 / 32
页数:8
相关论文
共 2 条
[1]   基于规则的汉语自动分词系统 [J].
姚天顺 ;
张桂平 ;
吴映明 ;
不详 .
中文信息学报 , 1990, (01) :37-43
[2]   书面汉语自动分词综述 [J].
梁南元 .
计算机应用与软件, 1987, (03) :44-50