汉英双语命名实体识别与对齐的交互式方法

被引:18
作者
陈钰枫 [1 ]
宗成庆 [1 ]
苏克毅 [2 ]
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
[2] 不详
关键词
命名实体; 识别; 双语对齐; 交互; 机器翻译;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
基于汉英双语命名实体的识别与对齐特性,文中提出了一种双语命名实体交互式对齐模型,其中的修正对齐计算体现了汉英实体识别与对齐的密切结合:一方面,利用双语对齐信息帮助实体识别;另一方面,实体的对齐过程对实体的识别结果又具有一定的修正作用,两方面的结合实现了双语实体识别与对齐之间的交互式互助过程.实验证明,这种交互式对齐模型不仅显著提高了汉英实体对齐的性能(F值从74.4%提高到81.2%),而且有效地提高了汉英实体识别的正确率和召回率.
引用
收藏
页码:1688 / 1696
页数:9
相关论文
共 4 条
[1]  
Alignment of bilingual named entities in parallel corpora using statistical models and multiple knowledge sources[J] . Chun-Jen Lee,Jason S. Chang,Jyh-Shing R. Jang.ACM Transactions on Asian Language Information Processing (TALIP) . 2006 (2)
[2]   Word reordering and a dynamic programming beam search algorithm for statistical machine translation [J].
Tillmann, C ;
Ney, H .
COMPUTATIONAL LINGUISTICS, 2003, 29 (01) :97-133
[3]   A systematic comparison of various statistical alignment models [J].
Och, FJ ;
Ney, H .
COMPUTATIONAL LINGUISTICS, 2003, 29 (01) :c-51
[4]   GENERALIZED ITERATIVE SCALING FOR LOG-LINEAR MODELS [J].
DARROCH, JN ;
RATCLIFF, D .
ANNALS OF MATHEMATICAL STATISTICS, 1972, 43 (05) :1470-&