共 6 条
基于统计方法的中文姓名识别研究
被引:3
作者:
贾品贵
杨一平
卢朋
机构:
[1] 中国科学院自动化所综合信息中心
来源:
关键词:
中文姓名识别;
基于汉字;
隐马尔可夫模型;
互信息;
D O I:
暂无
中图分类号:
TP391.43 [];
学科分类号:
0811 ;
081101 ;
081104 ;
1405 ;
摘要:
采用统计方法来识别中文姓名。该方法将中文姓名的识别过程分为姓名候选和姓名确认两个阶段。采用隐马尔可夫模型(HMM)分类器从未经切分的汉字串中候选姓名。利用人名与上下文词汇的互信息对候选人名进行最后的确认。该方法是完全数据驱动的,不需要姓名识别模板和规则。试验结果表明,该方法的召回率为82.7%,准确率为89.6%。
引用
收藏
页码:168 / 170
页数:3
相关论文