基于条件随机场的维吾尔人名识别方法

被引:17
作者
艾斯卡尔肉孜 [1 ]
宗成庆 [2 ]
姑丽加玛丽麦麦提艾力 [3 ]
热合木马合木提 [4 ]
艾斯卡尔艾木都拉 [4 ]
机构
[1] 新疆大学数学与系统科学学院
[2] 中国科学研究院自动化研究所
[3] 新疆师范大学数学科学学院
[4] 新疆大学信息科学与工程学院
关键词
人名识别; 命名实体; 条件随机场; 贪婪算法; 维吾尔语;
D O I
10.16511/j.cnki.qhdxxb.2013.06.030
中图分类号
TP391.43 [];
学科分类号
摘要
人名识别是自然语言处理中具有挑战性的任务之一。该文实现了基于条件随机场的维吾尔人名识别。首先从对维吾尔语黏着性特点的分析入手,研究总结了维吾尔人名的构成特点,实现了以词形、词性、词干、后缀、首音节、最后一个音节和最近一个动词等为特征,基于条件随机场的维吾尔语人名识别方法,并设计了选取最佳特征模板的贪婪算法。实验结果表明:该方法达到了较高的性能,识别维吾尔人名的准确率、召回率和F-score分别达到了90.03%、82.96%和86.35%。
引用
收藏
页码:873 / 877
页数:5
相关论文
共 10 条
[1]   汉英双语命名实体识别与对齐的交互式方法 [J].
陈钰枫 ;
宗成庆 ;
苏克毅 .
计算机学报, 2011, 34 (09) :1688-1696
[2]   基于可信度模型的中文人名识别研究 [J].
倪吉 ;
孔芳 ;
朱巧明 ;
李培峰 .
中文信息学报, 2011, (03) :45-50
[3]   基于条件随机场的英文产品命名实体识别 [J].
张朝胜 ;
郭剑毅 ;
线岩团 ;
余正涛 ;
雷春雅 ;
王海雄 .
计算机工程与科学, 2010, 32 (06) :115-117
[4]   基于多层条件随机场的中文命名实体识别 [J].
胡文博 ;
都云程 ;
吕学强 ;
施水才 .
计算机工程与应用, 2009, 45 (01) :163-165+227
[5]   一种人名识别方法的研究 [J].
张素香 ;
张素贤 ;
王小捷 .
计算机工程与应用 , 2008, (21) :157-161
[6]   融合多特征的最大熵汉语命名实体识别模型 [J].
张玥杰 ;
徐智婷 ;
薛向阳 .
计算机研究与发展, 2008, (06) :1004-1010
[7]   基于支持向量机的中国人名的自动识别 [J].
李丽双 ;
黄德根 ;
毛婷婷 ;
徐潇潇 .
计算机工程, 2006, (19) :188-190+201
[8]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[9]   一个统计与规则相结合的中文命名实体识别系统 [J].
向晓雯 ;
史晓东 ;
曾华琳 .
计算机应用, 2005, (10) :2404-2406
[10]   中文金融新闻中公司名的识别 [J].
王宁 ;
葛瑞芳 ;
苑春法 ;
黄锦辉 ;
李文捷 .
中文信息学报, 2002, (02) :1-6