基于统计方法的中文姓名识别研究

被引:3
作者
贾品贵
杨一平
卢朋
机构
[1] 中国科学院自动化所综合信息中心
关键词
中文姓名识别; 基于汉字; 隐马尔可夫模型; 互信息;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
采用统计方法来识别中文姓名。该方法将中文姓名的识别过程分为姓名候选和姓名确认两个阶段。采用隐马尔可夫模型(HMM)分类器从未经切分的汉字串中候选姓名。利用人名与上下文词汇的互信息对候选人名进行最后的确认。该方法是完全数据驱动的,不需要姓名识别模板和规则。试验结果表明,该方法的召回率为82.7%,准确率为89.6%。
引用
收藏
页码:168 / 170
页数:3
相关论文
共 6 条
[1]   一种基于可信度的人名识别方法 [J].
罗智勇 ;
宋柔 .
中文信息学报, 2005, (03) :67-72+86
[2]   基于统计的中文姓名识别方法研究 [J].
张锋 ;
樊孝忠 ;
许云 .
计算机工程与应用, 2004, (10) :53-54+77
[3]   基于姓氏驱动的中国姓名自动识别方法 [J].
张仰森 ;
徐波 ;
曹元大 ;
宗成庆 .
计算机工程与应用, 2003, (04) :62-65
[4]   基于分解与动态规划策略的汉语未登录词识别 [J].
吕雅娟 ;
赵铁军 ;
杨沐昀 ;
于浩 ;
李生 .
中文信息学报, 2001, (01) :28-33
[5]   基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[6]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21