基于统计方法的中文姓名识别

被引:33
作者
黄德根
杨元生
王省
张艳丽
钟万勰
机构
[1] 大连理工大学计算机科学与工程系!大连大连理工大学工程力学研究所大连
[2] 大连理工大学计算机科学与工程系!大连
[3] 大连理工大学工程力学研究所!大连
关键词
双词同现频度; 单词频度; 学习机制; 中文姓名识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 %
引用
收藏
页码:31 / 37+44 +44
页数:8
相关论文
共 5 条