基于可信度模型的中文人名识别研究

被引:7
作者
倪吉
孔芳
朱巧明
李培峰
机构
[1] 苏州大学计算机科学与技术学院
[2] 江苏省计算机信息处理技术重点实验室
关键词
人名识别; 可信度; 内聚度; 边界模板;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
该文根据中国人名的形成方式,总结和统计了人名的用字特征和边界模板特征,通过计算人名内聚度、人名区分度和边界模板可信度的综合概率作为人名可信度,对文本中人名进行识别或对已识别的人名进行纠正。该文将可信度检测模块嵌入到一个简易的命名实体平台中,在MSRA的语料上进行测试,实验结果说明可信度模型使得平台的人名识别F值提高了2.27%,整个系统的人名识别F值达到了91.72%。
引用
收藏
页码:45 / 50
页数:6
相关论文
共 11 条
[1]   基于最大熵模型的中文姓名识别 [J].
贾宁 ;
张全 .
计算机工程, 2007, (09) :31-33
[2]   边界模板和局部统计相结合的中国人名识别 [J].
李中国 ;
刘颖 .
中文信息学报, 2006, (05) :44-50
[3]   一种基于可信度的人名识别方法 [J].
罗智勇 ;
宋柔 .
中文信息学报, 2005, (03) :67-72+86
[4]   基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[5]   基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[6]   基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[7]   中文人名自动识别的一种有效方法 [J].
李建华 ;
王晓龙 .
高技术通讯, 2000, (02) :49-52
[8]   基于语料库的中文姓名识别方法研究 [J].
郑家恒 ;
李鑫 ;
谭红叶 .
中文信息学报, 2000, (01) :7-12
[9]   基于结合性自动识别中文姓名 [J].
张跃 ;
姚天顺 .
小型微型计算机系统, 1997, (10) :44-49
[10]  
信息抽取中关键技术的研究[D]. 张素香.北京邮电大学. 2007