基于统计方法的中文姓名识别研究

被引：3

作者：

贾品贵

杨一平

卢朋

机构：

[1] 中国科学院自动化所综合信息中心

来源：

计算机工程与应用 | 2006年 / 31期

关键词：

中文姓名识别; 基于汉字; 隐马尔可夫模型; 互信息;

D O I：

暂无

中图分类号：

TP391.43 [];

学科分类号：

0811 ; 081101 ; 081104 ; 1405 ;

摘要：

采用统计方法来识别中文姓名。该方法将中文姓名的识别过程分为姓名候选和姓名确认两个阶段。采用隐马尔可夫模型(HMM)分类器从未经切分的汉字串中候选姓名。利用人名与上下文词汇的互信息对候选人名进行最后的确认。该方法是完全数据驱动的,不需要姓名识别模板和规则。试验结果表明,该方法的召回率为82.7%,准确率为89.6%。

引用

页码：168 / 170

页数：3

共 6 条

[1] 一种基于可信度的人名识别方法 [J].