基于CRF的蒙古文人名自动识别研究

被引:3
作者
吴金星 [1 ]
那顺乌日图 [1 ]
杨振新 [2 ]
机构
[1] 内蒙古大学蒙古学学院
[2] 中国科学院合肥智能机械研究所
关键词
蒙古文人名; 识别; 条件随机场; 特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
以蒙古文人名识别为目的,实现了基于条件随机场模型的人名自动识别。从蒙古语黏着性特点分析入手,研究了蒙古语语料库中人名的存在形式以及各类人名的特点,针对蒙古语语料库中人名的特点,在词汇特征、词性特征和指示词特征等基本特征基础上引入了汉语姓氏特征、人名词典特征、兼类人名特征以及双词根特征。以内蒙古大学开发的100万词规模的标注语料库为训练数据,该模型的人名识别性能达到了94.56%的准确率,90.60%的召回率和92.54%的F值。该方法比起以往的基于规则的系统取得了较好的结果。
引用
收藏
页码:2014 / 2017
页数:4
相关论文
共 8 条
  • [1] 基于蒙古文语料库的人名自动识别.[D].通拉嘎.中央民族大学.2013, 12
  • [2] 利用CRF实现中文人名性别的自动识别
    赵晓凡
    赵丹
    刘永革
    [J]. 微电子学与计算机, 2011, 28 (10) : 122 - 124+128
  • [3] 基于条件随机场的蒙古语词性标注方法
    应玉龙
    李淼
    乌达巴拉
    朱海
    [J]. 计算机应用, 2010, 30 (08) : 2038 - 2040
  • [4] 基于多层条件随机场的中文命名实体识别
    胡文博
    都云程
    吕学强
    施水才
    [J]. 计算机工程与应用, 2009, 45 (01) : 163 - 165+227
  • [5] 一个统计与规则相结合的中文命名实体识别系统
    向晓雯
    史晓东
    曾华琳
    [J]. 计算机应用, 2005, (10) : 2404 - 2406
  • [6] 基于条件随机场的中文命名实体识别.[D].向晓雯.厦门大学.2006, 01
  • [7] A survey of Named Entity Recognition in English and other Indian Languages.[J].Kaur; Darvinder;Gupta; Vishal.International Journal of Computer Science Issues (IJCSI).2010, 6
  • [8] Rapid development of Hindi named entity recognition using conditional random fields and feature induction.[J].Wei Li;Andrew McCallum.ACM Transactions on Asian Language Information Processing (TALIP).2003, 3