基于最大熵模型的中文姓名识别

被引:5
作者
贾宁 [1 ]
张全 [2 ]
机构
[1] 中国科学院研究生院
[2] 中国科学院声学研究所
关键词
中文姓名识别; 最大熵; 特征函数;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
最大熵模型可以对非常广泛的自然语言现象建立概率模型,该文提出了一种使用统计模型的中文姓名识别方法,采用最大熵原则建立统计模型,并运用该模型计算姓名概率。系统采用真实语料进行开放测试的结果表明,在保证一定准确率的情况下,系统召回率可达90%以上。
引用
收藏
页码:31 / 33
页数:3
相关论文
共 6 条
[1]   基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[2]   自动标引中中文姓名的切分 [J].
靳从 ;
唐振民 ;
杨静宇 .
计算机工程, 2003, (22) :153-154
[3]   基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[4]   基于统计和规则的中文姓名自动辨识 [J].
季姮 ;
罗振声 .
语言文字应用, 2001, (01) :14-18
[5]   基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[6]   基于结合性自动识别中文姓名 [J].
张跃 ;
姚天顺 .
小型微型计算机系统, 1997, (10) :44-49