统计与规则相结合的藏文人名自动识别研究

被引:11
作者
窦嵘 [1 ]
加羊吉 [2 ]
黄伟 [3 ]
机构
[1] 甘肃同元信息系统技术有限责任公司
[2] 西北民族大学中国民族语言文字信息技术重点实验室
[3] 周口师范学院计算机科学技术系
关键词
藏文人名识别; 互信息; 格助词; 人名词典;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题。实验结果表明,该方法具有较高的准确率和召回率。
引用
收藏
页码:113 / 115
页数:3
相关论文
共 9 条
[1]   基于最大熵模型的中文姓名识别 [J].
贾宁 ;
张全 .
计算机工程, 2007, (09) :31-33
[2]   基于支持向量机的中国人名的自动识别 [J].
李丽双 ;
黄德根 ;
毛婷婷 ;
徐潇潇 .
计算机工程, 2006, (19) :188-190+201
[3]   基于统计和规则的中文姓名自动辨识 [J].
季姮 ;
罗振声 .
语言文字应用, 2001, (01) :14-18
[4]   基于分解与动态规划策略的汉语未登录词识别 [J].
吕雅娟 ;
赵铁军 ;
杨沐昀 ;
于浩 ;
李生 .
中文信息学报, 2001, (01) :28-33
[5]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[6]   中文姓名的自动辨识 [J].
孙茂松,黄昌宁,高海燕,方捷 .
中文信息学报, 1995, (02) :16-27
[7]  
实用藏文文法教程[M]. 四川民族出版社 , 格桑居冕, 2004
[8]  
藏族人名研究[M]. 民族出版社 , 王贵著, 1991
[9]  
An Algorithm that Learns What's in a Name[J] . Daniel M. Bikel,Richard Schwartz,Ralph M. Weischedel.Machine Learning . 1999 (1-3)