一种基于词频统计的组织机构名识别方法

被引:16
作者
胡万亭
杨燕
尹红风
贾真
刘利
机构
[1] 西南交通大学信息科学与技术学院云计算与智能技术省级高校重点实验室
关键词
统计; 词频; 机构名构成词; 组织机构名识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成词的词频统计。在此基础上,构建了数学模型,实现了组织机构名识别算法。该识别算法集成到了中文分词中,取得了较好的识别结果,可以满足一定的实际应用需求。
引用
收藏
页码:2014 / 2016
页数:3
相关论文
共 8 条
[1]  
汉语机构名的构成模式.[A].雷静;.全国第七届计算语言学联合学术会议.2003,
[2]   基于SVM和CRF的双层模型中文机构名识别 [J].
黄德根 ;
李泽中 ;
万如 .
大连理工大学学报, 2010, 50 (05) :782-787
[3]   基于多层条件随机场的中文命名实体识别 [J].
胡文博 ;
都云程 ;
吕学强 ;
施水才 .
计算机工程与应用 , 2009, (01) :163-165+227
[4]   基于支持向量机方法的中文组织机构名的识别 [J].
陈霄 ;
刘慧 ;
陈玉泉 .
计算机应用研究, 2008, (02) :362-364+367
[5]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[6]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[7]   一个统计与规则相结合的中文命名实体识别系统 [J].
向晓雯 ;
史晓东 ;
曾华琳 .
计算机应用, 2005, (10) :2404-2406
[8]   中文机构名称的识别与分析 [J].
张小衡 ;
王玲玲 .
中文信息学报, 1997, (04) :22-33