一种高效的基于启发式规则和词典相结合的双语词对齐方法

被引:11
作者
任志敏
蔡东风
尹宝生
机构
[1] 沈阳航空航空航天大学知识工程中心
关键词
自然语言处理; 双语词对齐; 锚点; 启发式规则; 高效;
D O I
暂无
中图分类号
H315.9 [翻译];
学科分类号
050212 [翻译学];
摘要
双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法,该方法充分利用现有资源,同时考虑到了后续的应用问题。实验表明,该方法在训练语料规模较小的情况下,取得了较好的对齐结果。
引用
收藏
页码:73 / 77
页数:5
相关论文
共 10 条
[1]
词语对齐的对数线性模型..刘洋;刘群;林守勋;.中国科学院计算技术研究所.2004,
[2]
统计和词典方法相结合的双语语料库词对齐.[A].吕雅娟;赵铁军;李生;杨沐昀;.全国第六届计算语言学联合学术会议.2001,
[3]
多策略英汉词对齐方法的研究 [J].
周蓝海 ;
蔡东风 .
计算机工程与设计, 2009, 30 (17) :4138-4141
[4]
基于条件随机场的中文组织机构名识别研究 [J].
周波 ;
蔡东风 .
沈阳航空工业学院学报, 2009, 26 (01) :49-52
[5]
基于最优邻接锚点消歧的词对齐方法 [J].
刘划 .
沈阳航空工业学院学报, 2009, 26 (01) :53-55
[6]
基于锚点词对的双语词对齐算法 [J].
张孝飞 ;
陈肇雄 ;
黄河燕 ;
王建德 .
小型微型计算机系统, 2006, (02) :330-334
[7]
无双语词典的英汉词对齐 [J].
吕学强 ;
吴宏林 ;
姚天顺 .
计算机学报, 2004, (08) :1036-1045
[8]
基于语义相似度并运用语言学知识进行双语语句词对齐 [J].
晋薇 ;
黄河燕 ;
夏云庆 .
计算机科学, 2002, (11) :44-47
[9]
语义关系的表达和知识系统的建造 [J].
董振东 .
语言文字应用, 1998, (03)
[10]
基于词典和统计的语料库词汇级对齐算法 [J].
刘小虎 ;
吴葳 ;
李生 ;
赵铁军 ;
蔡萌 ;
鞠英杰 .
情报学报, 1997, (01)