中文姓名自动识别系统的设计与实现

被引:4
作者
余祖波
高庆狮
方淼
机构
[1] 大连理工大学计算机系
关键词
中文姓名识别; 姓氏优先级; 姓氏用字集; 集合划分;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
论文在对大规模姓名样本库、姓名语料库进行统计的基础上,将姓氏库中的姓氏按优先级分类,并研究了前300个姓氏作普通单字时其上下文用字规律,将确定真姓氏并识别姓名的过程看作对句子的姓氏用字集进行划分的过程,设计实现了一个中文姓名自动识别试验系统。同时提出多级阈值的概念,即姓名右边界阈值和识别阈值均是优先级的函数。对系统的开放测试召回率和准确率分别为80.62%、89.27%。
引用
收藏
页码:5 / 7
页数:3
相关论文
共 4 条
  • [1] 基于角色标注的中国人名自动识别研究
    张华平
    刘群
    [J]. 计算机学报, 2004, (01) : 85 - 91
  • [2] 基于姓氏驱动的中国姓名自动识别方法
    张仰森
    徐波
    曹元大
    宗成庆
    [J]. 计算机工程与应用, 2003, (04) : 62 - 65
  • [3] 基于统计方法的中文姓名识别
    黄德根
    杨元生
    王省
    张艳丽
    钟万勰
    [J]. 中文信息学报, 2001, (02) : 31 - 37+44
  • [4] 基于统计和规则的中文姓名自动辨识
    季姮
    罗振声
    [J]. 语言文字应用, 2001, (01) : 14 - 18