多策略机器翻译系统IHSMTS中候选实例模式检索算法

被引:2
作者
张孝飞
陈肇雄
黄河燕
代六玲
机构
[1] 中国科技大学计算机系
[2] 中国科学院计算机语言信息工程研究中心
[3] 中国科学院计算机语言信息工程研究中心 安徽合肥
[4] 北京
[5] 南京理工大学计算机系
[6] 江苏南京
关键词
基于实例的机器翻译; 实例模式库; 候选实例; 词表层特征; 信息熵;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
081203 ; 0835 ;
摘要
基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是EBMT系统所必须解决的一大难题.文章基于句子的词表层特征和信息熵提出了一种多层次候选实例模式检索算法,通过在多策略机器翻译系统IHSMTS上的运行测试,结果表明该算法较好的解决了这一难题.
引用
收藏
页码:330 / 334
页数:5
相关论文
共 1 条
[1]   智能化英汉机译系统IMT/EC [J].
陈肇雄 ;
高庆狮 .
中国科学(A辑 数学 物理学 天文学 技术科学), 1989, (02) :186-194