基于统计方法的中文姓名识别

被引：33

作者：

黄德根

杨元生

王省

张艳丽

钟万勰

机构：

[1] 大连理工大学计算机科学与工程系!大连大连理工大学工程力学研究所大连

[2] 大连理工大学计算机科学与工程系!大连

[3] 大连理工大学工程力学研究所!大连

来源：

中文信息学报 | 2001年 / 02期

关键词：

双词同现频度; 单词频度; 学习机制; 中文姓名识别;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 %

引用

页码：31 / 37+44 +44

页数：8

共 5 条

[1] 汉语词语边界自动划分的模型与算法
付国宏
王晓龙
不详
[J]. 计算机研究与发展 , 1999, (09) : 1142 - 1147
[2] 利用汉字二元语法关系解决汉语自动分词中的交集型歧义
孙茂松
黄昌宁
邹嘉彦
陆方
沈达阳
[J]. 计算机研究与发展, 1997, (05) : 14 - 21
[3] 一种汉语分词方法
吴胜远
[J]. 计算机研究与发展 , 1996, (04) : 306 - 311
[4] 中文姓名的自动辨识
孙茂松，黄昌宁，高海燕，方捷
[J]. 中文信息学报, 1995, (02) : 16 - 27
[5] 多语料库作法之中文姓名辨识
张俊盛
陈舜德
郑萦
刘显仲
柯淑津
[J]. 中文信息学报, 1992, (03) : 7 - 15

← 1 →