基于统计的中文姓名识别方法研究

被引:23
作者
张锋
樊孝忠
许云
不详
机构
[1] 北京理工大学计算机科学工程系
[2] 北京理工大学计算机科学工程系 北京
[3] 北京
[4] 北京
关键词
自动分词; 未登录词; 中文姓名识别;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓名的自动识别,实验测试结果:准确率93.82%、召回率89.37%。
引用
收藏
页码:53 / 54+77 +77
页数:3
相关论文
共 3 条
  • [1] 基于统计方法的中文姓名识别
    刘秉伟
    黄萱菁
    郭以昆
    吴立德
    [J]. 中文信息学报, 2000, (03) : 16 - 24+36
  • [2] 基于语料库的中文姓名识别方法研究
    郑家恒
    李鑫
    谭红叶
    [J]. 中文信息学报, 2000, (01) : 7 - 12
  • [3] 中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000