一种基于共坐标上升算法的人名识别方法

被引:6
作者
戴播
毛奇
袁春风
机构
[1] 南京大学计算机软件新技术国家重点实验室
关键词
共坐标上升算法; 人名识别; 特征权重训练;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
共坐标上升算法(coordinate ascent algorithm)是一种迭代优化技术,可以用来指导特征权值的训练。提出一种基于该算法的中国人名识别方法,避免了已有的一些方法中人为指定特征权值的问题,更好地体现特征之间存在的隐含关系。该方法从基础语料中获取特征库及成名概率词典,在训练语料上提取相应特征后,采用共坐标上升学习算法训练得到特征权重以及成名阈值参数,运用学习得到的各参数对普通文本中的中国人名进行识别。提出的方法无需对训练语料进行人工标注,在人名识别时也无需进行分词和词性标注处理,代价低、性能优良、有较好的实用性,在开放测试集上F1值达到93.02%。
引用
收藏
页码:7 / 9+22 +22
页数:4
相关论文
共 11 条
[1]
基于姓氏用字驱动的混合中文姓名识别算法 [J].
刘力科 ;
陈蓉 ;
张南 ;
刘杰 ;
于中华 .
四川大学学报(自然科学版), 2007, (04) :795-798
[2]
基于混合模型的中国人名自动识别 [J].
毛婷婷 ;
李丽双 ;
黄德根 .
中文信息学报, 2007, (02) :22-28
[3]
一种与分词一体化的中文人名识别方法 [J].
高红 ;
黄德根 ;
杨元生 .
计算机工程, 2006, (19) :9-10+13
[4]
基于支持向量机的中国人名的自动识别 [J].
李丽双 ;
黄德根 ;
毛婷婷 ;
徐潇潇 .
计算机工程, 2006, (19) :188-190+201
[5]
基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[6]
基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[7]
基于统计的中文姓名识别方法研究 [J].
张锋 ;
樊孝忠 ;
许云 .
计算机工程与应用, 2004, (10) :53-54+77
[8]
基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[9]
基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[10]
基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36