基于姓氏用字驱动的混合中文姓名识别算法

被引：2

作者：

刘力科 ^{[1
]}

陈蓉 ^{[1
]}

张南 ^{[1
]}

刘杰 ^{[2
]}

于中华 ^{[1
]}

机构：

[1] 四川大学计算机学院

[2] 贵州警官职业学院计算中心

来源：

四川大学学报(自然科学版) | 2007年 / 04期

基金：

高等学校博士学科点专项科研基金;

关键词：

中文姓名识别; 混合人名识别; 阈值筛选;

D O I：

暂无

中图分类号：

TP391.4 [模式识别与装置];

学科分类号：

0811 ; 081101 ; 081104 ; 1405 ;

摘要：

中文姓名识别是信息抽取的一个重要研究内容,同时也对自然语言处理的其他应用具有重要意义.本文针对中文姓名构成的一般规律和特点,提出了一种姓氏用字驱动的统计与规则相结合的混合中文姓名识别算法,该算法以姓氏用字为线索,通过对前后文中汉字串成词的可能性的评价来进行姓名识别.对所提出的算法用144 K文本进行了实验测试,验证了它的有效性.

引用

页码：795 / 798

页数：4

共 4 条

[1] 基于统计和规则的中文姓名自动辨识 [J].