一种基于实例的汉英机器翻译策略

被引:6
作者
胡国全
陈家骏
戴新宇
尹存燕
机构
[1] 南京大学计算机软件新技术国家重点实验室
关键词
自然语言处理; 机器翻译; 基于实例;
D O I
10.16208/j.issn1000-7024.2005.04.019
中图分类号
TP391.2 [翻译机];
学科分类号
摘要
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。
引用
收藏
页码:900 / 903+906 +906
页数:5
相关论文
共 4 条
[1]   基于聚类的语料库分词评价方法研究 [J].
宋礼鹏 ;
郑家恒 .
计算机学报, 2004, (02) :192-196
[2]   一种面向汉英口语翻译的双语语块处理方法 [J].
程葳 ;
赵军 ;
徐波 ;
刘非凡 .
中文信息学报, 2003, (02) :21-27
[3]   基于双语语料的单个源语词汇和目标语多词单元的对齐 [J].
陈博兴 ;
杜利民 .
中文信息学报, 2003, (01) :13-19
[4]  
语言计算与基于内容的文本处理.[M].孙茂松;陈群秀主编;.清华大学出版社.2003,