中文组织机构名称与简称的识别

被引:29
作者
沈嘉懿 [1 ]
李芳 [1 ]
徐飞玉 [2 ]
Hans Uszkoreit [2 ]
机构
[1] 上海交通大学计算机系
[2] 德国人工智能研究中心语言技术实验室
关键词
计算机应用; 中文信息处理; 组织机构名称识别; 组织机构简称识别; 规则匹配; 贝叶斯概率模型;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文提出了一种基于规则识别中文组织机构全称和简称的方法。全称的识别首先借助机构后缀词库获得其右边界,然后通过规则匹配并借助贝叶斯概率模型加以决策获得其左边界。简称的识别是在全称的基础上应用其对应的简称规则实现的。在开放性测试中,该方法的总体查全率为85.19%,查准率为83.03%,F Measure为84.10%;简称的查全率为67.18%,查准率为74.14%。目前该方法已应用于中文关系的抽取系统。
引用
收藏
页码:17 / 21
页数:5
相关论文
共 1 条