一种面向汉英口语翻译的双语语块处理方法

被引:6
作者
程葳
赵军
徐波
刘非凡
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
关键词
人工智能; 机器翻译; 统计机器翻译; 口语翻译; 语料库; 语块;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
摘要
基于语块的处理方法是近年来自然语言处理领域兴起的一条新思路。但是 ,要将其应用于口语翻译当中 ,还需按照口语特点对涉及双语的语块概念做出合理界定。本文在已有单语语块定义的基础上 ,根据中、英文差异和口语翻译特性 ,从句法和语义两个层次提出了一种汉英双语语块概念 ,并对其特点进行了分析。同时 ,针对中、英文并行语料库 ,建立了一套计算机自动划分与人工校对相结合的双语语块加工方法。应用该方法 ,对汉英句子级对齐的口语语料进行双语语块划分和对整 ,并以此为基础进行了基于双语语块的口语统计机器翻译实验。结果表明 ,本文提出的双语语块定义符合口语翻译的实际需要 ,使用基于双语语块的语料处理方法 ,能有效地提高口语系统的翻译性能
引用
收藏
页码:21 / 27
页数:7
相关论文
共 8 条
[1]   一种基于E-Chunk的机器翻译模型 [J].
李 沐 ;
吕学强 ;
姚天顺 .
软件学报, 2002, (04) :669-676
[2]   一种面向口语的译文质量自动评价方法 [J].
程葳 ;
徐波 .
中文信息学报, 2002, (02) :47-53
[3]   基于统计的汉语组块分析 [J].
刘芳 ;
赵铁军 ;
于浩 ;
杨沐昀 ;
方高林 .
中文信息学报, 2000, (06) :28-32+39
[4]   浅层句法分析方法概述 [J].
孙宏林 ;
俞士汶 .
当代语言学, 2000, (02) :74-83+124
[5]   汉语句子的组块分析体系 [J].
周强 ;
孙茂松 ;
黄昌宁 .
计算机学报, 1999, (11) :1158-1165
[6]   口语自动翻译系统技术评析 [J].
宗成庆 ;
黄泰翼 ;
徐波 .
中文信息学报, 1999, (02) :57-66
[7]  
构建大规模的汉语语块库[A]. 周强,詹卫东,任海波.自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C]. 2001
[8]  
信息处理用汉语句子语序的认知研究[A]. 鲁川.辉煌二十年——中国中文信息学会二十周年学术会议论文集[C]. 2001