基于层次特征的藏文人名识别研究

被引:26
作者
刘飞飞 [1 ,2 ]
王志娟 [1 ,2 ]
机构
[1] 中央民族大学信息工程学院
[2] 国家语言资源监测与研究中心少数民族语言分中心
关键词
人名识别; 层次特征; 藏文; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为了提高藏文人名识别的效果,提出了结合三层的层次特征的藏文人名识别算法。提出了无须分词,仅在藏文音节粒度上,基于藏文人名三层特征:内部特征、上下文信息、并列关系特征,利用条件随机场(conditional random fields,CRF)算法进行藏文人名识别的研究。首先将人名的内部和上下文特征作为CRF特征,然后将人名并列关系特征设计为规则进一步提高识别效果。在不影响准确率的情况下,最终将人名识别的召回率提高了10.43%,综合F值达到了95.02%。其中对于藏族人名的F值提升了11%,音译人名识别的F值达到了94.09%。实验结果表明,该方法可以有效提升藏文人名的识别效果。
引用
收藏
页码:2583 / 2587+2596 +2596
页数:6
相关论文
共 10 条
[1]
基于规则的命名实体识别研究 [D]. 
周昆 .
合肥工业大学,
2010
[2]
基于条件随机场的藏文人名识别研究 [J].
康才畯 ;
龙从军 ;
江荻 .
计算机工程与应用, 2015, 51 (03) :109-111+185
[3]
最大熵和条件随机场模型相融合的藏文人名识别 [J].
加羊吉 ;
李亚超 ;
宗成庆 ;
于洪志 .
中文信息学报, 2014, (01) :107-112
[4]
基于感知机模型藏文命名实体识别 [J].
华却才让 ;
姜文斌 ;
赵海兴 ;
刘群 .
计算机工程与应用, 2014, 50 (15) :172-176
[5]
藏语命名实体识别研究 [J].
金明 ;
杨欢欢 ;
单广荣 .
西北民族大学学报(自然科学版), 2010, 31 (03) :49-52
[6]
统计与规则相结合的藏文人名自动识别研究 [J].
窦嵘 ;
加羊吉 ;
黄伟 .
长春工程学院学报(自然科学版), 2010, 11 (02) :113-115
[7]
基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[8]
百家姓.[M].(宋) 佚名; 著##(宋) 王应麟; 著##(梁) 周兴嗣; 著.远方出版社.2007,
[9]
Robust multilingual Named Entity Recognition with shallow semi-supervised features.[J].Rodrigo Agerri;German Rigau.Artificial Intelligence.2016,
[10]
A survey of named entity recognition and classification [J].
Nadeau, David ;
Sekine, Satoshi .
LINGUISTICAE INVESTIGATIONES, 2007, 30 (01) :3-26