基于统计和规则的中文姓名自动辨识

被引:11
作者
季姮
罗振声
机构
[1] 清华大学中文系计算语言研究室北京!
关键词
概率分布; 规则筛选; 兼类姓; 专有人名; 特殊候选姓名对;
D O I
10.16499/j.cnki.1003-5397.2001.01.002
中图分类号
H085.6 [];
学科分类号
摘要
中文姓名的辨识是自动分词、自动文摘的基础。独立于自动分词 ,我们运用姓名用字概率和规则 ,设计并实现了一个中文姓名辨识系统。对 2 0 775 7字语料进行了测试 ,召回率达到 92 .5 7% ,精确率达到 80 .35 % ,且速度较快。
引用
收藏
页码:14 / 18
页数:5
相关论文
共 5 条
  • [1] 中文姓名的自动辨识
    孙茂松,黄昌宁,高海燕,方捷
    [J]. 中文信息学报, 1995, (02) : 16 - 27
  • [2] 多语料库作法之中文姓名辨识
    张俊盛
    陈舜德
    郑萦
    刘显仲
    柯淑津
    [J]. 中文信息学报, 1992, (03) : 7 - 15
  • [3] 姓氏人名用字分析统计[M]. 语文出版社 , 中国社会科学院语言文字应用研究所汉字整理研究室编, 1991
  • [4] 计算语言学文集. 王省,黄德根,杨元生. 清华大学出版社 . 1999
  • [5] 计算语言研究与应用. 宋柔,朱宏,潘维佳,尹振海. 北京语言学院出版社 . 1993