最大熵和条件随机场模型相融合的藏文人名识别

被引:21
作者
加羊吉 [1 ]
李亚超 [1 ]
宗成庆 [2 ]
于洪志 [1 ]
机构
[1] 西北民族大学中国民族语言文字信息技术重点实验室
[2] 中国科学院自动化研究所模式识别国家重点实验室
基金
中央高校基本科研业务费专项资金资助;
关键词
藏文人名识别; 最大熵; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。
引用
收藏
页码:107 / 112
页数:6
相关论文
共 11 条
[1]   基于条件随机场的中国人名识别方法 [J].
张素香 ;
高国洋 ;
戚银城 .
郑州大学学报(理学版), 2009, 41 (02) :40-43
[2]   浅谈藏族人名的文化含义及其翻译原则 [J].
尕藏卓玛 .
西北民族大学学报(哲学社会科学版), 2008, (05) :113-116
[3]   基于最大熵模型和规则的中文姓名识别 [J].
贾宁 ;
张全 .
计算机工程与应用, 2007, (35) :1-4
[4]   基于混合模型的中国人名自动识别 [J].
毛婷婷 ;
李丽双 ;
黄德根 .
中文信息学报, 2007, (02) :22-28
[5]   边界模板和局部统计相结合的中国人名识别 [J].
李中国 ;
刘颖 .
中文信息学报, 2006, (05) :44-50
[6]   基于最大熵的汉语人名地名识别方法研究 [J].
钱晶 ;
张杰 ;
张涛 .
小型微型计算机系统, 2006, (09) :1761-1765
[7]   基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[8]   基于语料库的中文姓名识别方法研究 [J].
郑家恒 ;
李鑫 ;
谭红叶 .
中文信息学报, 2000, (01) :7-12
[9]  
藏族人名汉译名识别研究[J]. 罗智勇,宋柔,朱小杰.情报学报. 2009 (03)
[10]  
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007