基于SVM和CRF的双层模型中文机构名识别

被引:13
作者
黄德根
李泽中
万如
机构
[1] 大连理工大学计算机科学与技术学院
基金
中央高校基本科研业务费专项资金资助;
关键词
机构名识别; 条件随机场(CRF); 支持向量机(SVM); 双层模型;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
提出了一种基于支持向量机(SVM)和条件随机场(CRF)的双层模型进行中文机构名识别的方法.第一层模型采用CRF识别简单机构名,并将识别结果传至第二层辅助下一步的识别;第二层采用基于驱动的方法,将SVM和CRF结合进行复杂机构名的识别;最后将两层的识别结果合并,并通过一个后续处理对置信度较低的识别结果进行修正.大规模真实语料的开放测试表明,精确率达到94.83%,召回率达到95.02%,证明了该方法的有效性.
引用
收藏
页码:782 / 787
页数:6
相关论文
共 5 条
[1]   基于支持向量机的中文文本中地名识别 [J].
李丽双 ;
黄德根 ;
陈春荣 ;
杨元生 .
大连理工大学学报, 2007, (03) :433-438
[2]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[3]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[4]   中文机构名称的识别与分析 [J].
张小衡 ;
王玲玲 .
中文信息学报, 1997, (04) :22-33
[5]  
Named entity recognition using an HMM-based Chunk Tagger .2 ZHOU Guo-dong,SU Jian. Proceedings of the40th Annual Meeting Association for Computational Linguistics . 2002