基于锚信息的生物医学文献双语摘要句子对齐

被引:4
作者
陈相
林鸿飞
机构
[1] 大连理工大学计算机科学与工程系
关键词
计算机应用; 中文信息处理; 句子对齐; 二部图; 双语语料; 相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为生物医学文献双语摘要建模。在无双语词典的情况下,将基于长度的句子对齐方法和句子的位置信息相结合,充分利用医学文献双语摘要语料中的锚信息,将生物医学摘要段落和句子进行分类计算相似度,实现了生物医学文献双语摘要的句子对齐,取得了较好的实验结果。
引用
收藏
页码:58 / 62+78 +78
页数:6
相关论文
共 7 条
[1]   基于长度和位置信息的双语句子对齐方法 [J].
李维刚 ;
刘挺 ;
张宇 ;
李生 .
哈尔滨工业大学学报, 2006, (05) :689-692
[2]   基于长度的扩展方法的汉英句子对齐 [J].
张艳 ;
柏冈秀纪 .
中文信息学报, 2005, (05) :31-36+58
[3]   无双语词典的英汉词对齐 [J].
吕学强 ;
吴宏林 ;
姚天顺 .
计算机学报, 2004, (08) :1036-1045
[4]   基于统计的汉英句子对齐研究 [J].
吕学强 ;
李清隐 ;
黄志丹 ;
沈嫣娜 ;
姚天顺 .
小型微型计算机系统, 2004, (06) :990-992
[5]   A systematic comparison of various statistical alignment models [J].
Och, FJ ;
Ney, H .
COMPUTATIONAL LINGUISTICS, 2003, 29 (01) :c-51
[6]  
Bilingual Collocation Extraction Based onLinguistic and Statistical Analyses .2 Wu D. National Tsing Hua University,Tai wan . 2003
[7]  
Aligning Parallel Bilingual Corpora Statistically with Punctuation Criteria .2 Thomas C.Chuang,Kevin C.Yeh. Computational Linguistics and Chinese Language Processing . 2005