中英命名实体识别及对齐中的中文分词优化

被引:35
作者
尹存燕
黄书剑
戴新宇
陈家骏
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 南京大学计算机科学与技术系
关键词
分词; 命名实体识别; 双语对齐; 机器翻译;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法.该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词.分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽取和统计机器翻译的效果.实验结果表明了本文优化方法的有效性.
引用
收藏
页码:1481 / 1487
页数:7
相关论文
共 6 条
[1]
基于音节首字母匹配的音译单元对齐方法 [J].
赵明明 ;
梁颖红 ;
周美玲 ;
姚建民 .
江南大学学报(自然科学版), 2009, 8 (06) :639-642
[2]
基于小规模尾字特征的中文命名实体识别研究 [J].
冯元勇 ;
孙乐 ;
张大鲲 ;
李文波 .
电子学报, 2008, (09) :1833-1838
[3]
中文分词十年回顾 [J].
黄昌宁 ;
赵海 .
中文信息学报, 2007, (03) :8-19
[4]
世界人名翻译大辞典.[M].新华通讯社译名室; 编.中国对外翻译出版公司.2007,
[5]
A Joint Model to Identify and Align Bilingual Named Entities [J].
Chen, Yufeng ;
Zong, Chengqing ;
Su, Keh-Yih .
COMPUTATIONAL LINGUISTICS, 2013, 39 (02) :229-266
[6]
Alignment of bilingual named entities in parallel corpora using statistical models and multiple knowledge sources.[J].Chun-Jen Lee;Jason S. Chang;Jyh-Shing R. Jang.ACM Transactions on Asian Language Information Processing (TALIP).2006, 2