基于多层条件随机场的中文命名实体识别

被引:26
作者
胡文博 [1 ,2 ]
都云程 [1 ,2 ]
吕学强 [1 ,2 ]
施水才 [1 ,2 ]
机构
[1] 北京信息科技大学中文信息处理研究中心
[2] 北京拓尔思信息技术有限公司
关键词
条件随机场; 命名实体识别; 命名实体;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。
引用
收藏
页码:163 / 165+227 +227
页数:4
相关论文
共 14 条
[1]  
基于条件随机场的命名实体识别研究.[D].郭家清.沈阳航空工业学院.2007, 02
[2]  
基于条件随机域的中文命名实体识别研究.[D].王志强.南京理工大学.2006, 01
[3]  
基于最大熵模型的中文人名识别方法研究.[D].乔羽.山西大学.2005, 07
[4]  
基于条件随机场的自动分词技术的研究.[D].陈晴.东北大学.2005, 07
[5]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[6]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[7]   一种统计和词性相结合的命名实体发现方法 [J].
庄明 ;
老松杨 ;
吴玲达 .
计算机应用, 2004, (01) :22-24
[8]   基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[9]   基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[10]   基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7