基于条件随机场的中文人名识别研究

被引:3
作者
邱莎 [1 ,2 ]
段玻 [1 ]
申浩如 [1 ]
丁海燕 [3 ]
机构
[1] 昆明学院信息技术学院
[2] 复旦大学计算机科学技术学院
[3] 云南大学信息学院
关键词
命名实体识别; 中文人名识别; 条件随机场; 条件概率; 特征模板; 序列标注;
D O I
10.14091/j.cnki.kmxyxb.2011.06.030
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计中文人名在文本中的条件概率分布,获得模型参数,并采用序列标注的方式完成中文人名识别任务.多次闭合测试和开放测试结果表明,F值基本都高于90%.
引用
收藏
页码:64 / 66
页数:3
相关论文
共 5 条
[1]   基于小规模尾字特征的中文命名实体识别研究 [J].
冯元勇 ;
孙乐 ;
张大鲲 ;
李文波 .
电子学报, 2008, (09) :1833-1838
[2]   基于混合模型的中国人名自动识别 [J].
毛婷婷 ;
李丽双 ;
黄德根 .
中文信息学报, 2007, (02) :22-28
[3]   基于统计方法的中文姓名识别研究 [J].
贾品贵 ;
杨一平 ;
卢朋 .
计算机工程与应用, 2006, (31) :168-170
[4]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[5]  
基于条件随机域的中文命名实体识别.[A].史树敏;王志强;周浪;冯冲;黄河燕;.第三届学生计算语言学研讨会.2006,