基于词典和统计的语料库词汇级对齐算法

被引:8
作者
刘小虎
吴葳
李生
赵铁军
蔡萌
鞠英杰
机构
[1] 哈尔滨工业大学计算机科学与工程系
[2] 黑龙江大学信息管理系
关键词
语料库,词汇级对齐,共现概率;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
摘要
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。实践证明该方法是行之有效的
引用
收藏
页码:20 / 26
页数:7
相关论文
empty
未找到相关数据