维吾尔语中汉族人名的识别及翻译

被引:27
作者
李佳正 [1 ]
刘凯 [1 ]
麦热哈巴艾力 [1 ,2 ]
吕雅娟 [1 ]
刘群 [1 ]
吐尔根依布拉音 [2 ]
机构
[1] 中国科学院计算技术研究所中国科学院智能信息处理重点实验室
[2] 新疆大学信息科学与工程学院
关键词
语言模型; 名词词缀; 拼写规则; 人名识别及翻译;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文研究了一种维吾尔语中汉族人名的识别和翻译方法。该方法在词典等传统方法的基础上,运用语言模型实现维语中的汉族人名的识别和翻译。针对维语人名的构词和拼写特点,增加了名词词缀识别预处理模块,补充了维语字母到汉语拼音的映射规则,有效提高了人名识别的正确率及召回率。在1 000句含有汉族人名的维语语料上进行测试,汉族人名识别的正确率和召回率分别达到75.2%和91.5%。
引用
收藏
页码:82 / 87
页数:6
相关论文
共 4 条
[1]
基于规则的维吾尔人名汉文机器翻译算法研究 [J].
衣马木艾山阿布都力克木 ;
吐尔地托合提 ;
艾斯卡尔艾木都拉 .
计算机应用与软件, 2010, 27 (08) :86-87+147
[2]
汉维语人名文化异同之比较 [J].
张秀玲 .
新疆大学学报(哲学·人文社会科学版), 2009, 37 (06) :136-139
[3]
基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[4]
基于分解与动态规划策略的汉语未登录词识别 [J].
吕雅娟 ;
赵铁军 ;
杨沐昀 ;
于浩 ;
李生 .
中文信息学报, 2001, (01) :28-33