CRF与规则相结合的中文地名识别

被引:17
作者
李丽双 [1 ,2 ]
党延忠 [1 ]
廖文平 [2 ]
黄德根 [2 ]
张颖 [2 ]
机构
[1] 大连理工大学管理科学与工程学院
[2] 大连理工大学计算机科学与技术学院
关键词
中文信息处理; 中文地名识别; 条件随机域; 基于规则的后处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%.
引用
收藏
页码:285 / 289
页数:5
相关论文
共 6 条
[1]   基于小规模尾字特征的中文命名实体识别研究 [J].
冯元勇 ;
孙乐 ;
张大鲲 ;
李文波 .
电子学报, 2008, (09) :1833-1838
[2]   基于单字提示特征的中文命名实体识别快速算法 [J].
冯元勇 ;
孙乐 ;
李文波 ;
张大鲲 .
中文信息学报, 2008, (01) :104-110
[3]   SVM与规则相结合的中文地名自动识别 [J].
李丽双 ;
黄德根 ;
陈春荣 ;
杨元生 .
中文信息学报, 2006, (05) :51-57
[4]   基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[5]   基于变换的中国地名自动识别研究(英文) [J].
谭红叶 ;
郑家恒 ;
刘开瑛 .
软件学报, 2001, (11) :1608-1613
[6]  
中国地名录[M]. 中国地图出版社 , 国家测绘局地名研究所编, 1995