共 5 条
基于统计方法的中文姓名识别
被引:33
作者:
黄德根
杨元生
王省
张艳丽
钟万勰
机构:
[1] 大连理工大学计算机科学与工程系!大连大连理工大学工程力学研究所大连
[2] 大连理工大学计算机科学与工程系!大连
[3] 大连理工大学工程力学研究所!大连
来源:
关键词:
双词同现频度;
单词频度;
学习机制;
中文姓名识别;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 %
引用
收藏
页码:31 / 37+44
+44
页数:8
相关论文