中文组织机构名称与简称的识别

被引：29

作者：

沈嘉懿 ^{[1
]}

李芳 ^{[1
]}

徐飞玉 ^{[2
]}

Hans Uszkoreit ^{[2
]}

机构：

[1] 上海交通大学计算机系

[2] 德国人工智能研究中心语言技术实验室

来源：

中文信息学报 | 2007年 / 06期

关键词：

计算机应用; 中文信息处理; 组织机构名称识别; 组织机构简称识别; 规则匹配; 贝叶斯概率模型;

D O I：

暂无

中图分类号：

TP391.4 [模式识别与装置];

学科分类号：

0811 ; 081101 ; 081104 ; 1405 ;

摘要：

本文提出了一种基于规则识别中文组织机构全称和简称的方法。全称的识别首先借助机构后缀词库获得其右边界,然后通过规则匹配并借助贝叶斯概率模型加以决策获得其左边界。简称的识别是在全称的基础上应用其对应的简称规则实现的。在开放性测试中,该方法的总体查全率为85.19%,查准率为83.03%,F Measure为84.10%;简称的查全率为67.18%,查准率为74.14%。目前该方法已应用于中文关系的抽取系统。

引用

页码：17 / 21

页数：5