基于姓氏驱动的中国姓名自动识别方法

被引:8
作者
张仰森
徐波
曹元大
宗成庆
机构
[1] 北京理工大学计算机系
[2] 中国科学院自动化所模式识别国家重点实验室
关键词
中国姓名识别; 分级加权模型; 姓氏驱动; 潜在人名;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
文章基于姓氏驱动和上下文信息,利用从真实姓名样本库和文本语料库中得到的大量统计数据,提出了一种中国姓名识别的分级加权筛选模型,利用基于这一模型的识别算法和冲突解决策略,实现中国人名的自动识别。通过从《人民日报》随机抽取的500个含有人名的句子进行测试,表明:中国姓名召回率达89.2%,精确率达93.15%。
引用
收藏
页码:62 / 65
页数:4
相关论文
共 4 条
  • [1] 基于统计方法的中文姓名识别
    刘秉伟
    黄萱菁
    郭以昆
    吴立德
    [J]. 中文信息学报, 2000, (03) : 16 - 24+36
  • [2] 中文姓名的自动辨识
    孙茂松,黄昌宁,高海燕,方捷
    [J]. 中文信息学报, 1995, (02) : 16 - 27
  • [3] 多语料库作法之中文姓名辨识
    张俊盛
    陈舜德
    郑萦
    刘显仲
    柯淑津
    [J]. 中文信息学报, 1992, (03) : 7 - 15
  • [4] 中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000