基于互信息的中文姓名识别方法

被引:12
作者
黄德根
马玉霞
杨元生
机构
[1] 大连理工大学计算机科学与工程系
[2] 大连理工大学计算机科学与工程系 辽宁大连 
[3] 辽宁大连 
关键词
中文姓名识别; 互信息; 上下文互信息; 内部互信息;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
提出并实现了一个基于互信息的中文姓名识别方法.该方法充分挖掘姓名和其上下文信息的关联程度以及姓名用字之间关联程度的信息,引入互信息对其进行定量的描述;提出中文姓名的上下文互信息、内部互信息等概念,并对其建立了动态评价函数.开放测试结果表明,该方法有效地提高了中文姓名识别的效果,保证了较高的精确率和召回率.
引用
收藏
页码:744 / 748
页数:5
相关论文
共 9 条
[1]   基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[2]   基于统计和规则的中文姓名自动辨识 [J].
季姮 ;
罗振声 .
语言文字应用, 2001, (01) :14-18
[3]   一个基于互信息的规则量化方法 [J].
高升 ;
贾文举 ;
王晓龙 ;
姜亚学 .
计算机研究与发展, 2000, (08) :984-989
[4]   基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[5]   基于语料库的中文姓名识别方法研究 [J].
郑家恒 ;
李鑫 ;
谭红叶 .
中文信息学报, 2000, (01) :7-12
[6]   语言模型中一种改进的最大熵方法及其应用 [J].
李涓子 ;
黄昌宁 .
软件学报, 1999, (03) :34-40
[7]   基于结合性自动识别中文姓名 [J].
张跃 ;
姚天顺 .
小型微型计算机系统, 1997, (10) :44-49
[8]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[9]   中文姓名的自动辨识 [J].
孙茂松,黄昌宁,高海燕,方捷 .
中文信息学报, 1995, (02) :16-27