基于姓氏用字驱动的混合中文姓名识别算法

被引:2
作者
刘力科 [1 ]
陈蓉 [1 ]
张南 [1 ]
刘杰 [2 ]
于中华 [1 ]
机构
[1] 四川大学计算机学院
[2] 贵州警官职业学院计算中心
基金
高等学校博士学科点专项科研基金;
关键词
中文姓名识别; 混合人名识别; 阈值筛选;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
中文姓名识别是信息抽取的一个重要研究内容,同时也对自然语言处理的其他应用具有重要意义.本文针对中文姓名构成的一般规律和特点,提出了一种姓氏用字驱动的统计与规则相结合的混合中文姓名识别算法,该算法以姓氏用字为线索,通过对前后文中汉字串成词的可能性的评价来进行姓名识别.对所提出的算法用144 K文本进行了实验测试,验证了它的有效性.
引用
收藏
页码:795 / 798
页数:4
相关论文
共 4 条
[1]   基于统计和规则的中文姓名自动辨识 [J].
季姮 ;
罗振声 .
语言文字应用, 2001, (01) :14-18
[2]   自动标引中中文姓名的切分 [J].
靳从 ;
唐振民 ;
杨静宇 .
计算机工程, 2003, (22) :153-154
[3]   基于统计的中文姓名识别方法研究 [J].
张锋 ;
樊孝忠 ;
许云 .
计算机工程与应用, 2004, (10) :53-54+77
[4]   一个中文新词识别特征的研究 [J].
秦浩伟 ;
步丰林 .
计算机工程, 2004, (S1) :369-370+414