基于感知机模型藏文命名实体识别

被引:28
作者
华却才让 [1 ,2 ]
姜文斌 [3 ]
赵海兴 [1 ]
刘群 [3 ]
机构
[1] 不详
[2] 陕西师范大学计算机学院
[3] 不详
[4] 青海师范大学藏文信息研究中心
[5] 中国科学院计算技术研究所
[6] 不详
关键词
藏文音节; 命名实体; 藏文命名实体; 感知机模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。
引用
收藏
页码:172 / 176
页数:5
相关论文
共 10 条
[1]   基于词对依存分类的藏语树库半自动构建研究 [J].
华却才让 ;
姜文斌 ;
赵海兴 ;
刘群 .
中文信息学报, 2013, (05) :166-172
[2]   藏文音节规则模型及应用 [J].
珠杰 ;
李天瑞 ;
格桑多吉 ;
仁青诺布 ;
乔少杰 .
北京大学学报(自然科学版), 2013, 49 (01) :68-74
[3]   藏文数词识别与翻译 [J].
孙萌 ;
华却才让 ;
刘凯 ;
吕雅娟 ;
刘群 .
北京大学学报(自然科学版), 2013, 49 (01) :75-80
[4]   藏语命名实体识别研究 [J].
金明 ;
杨欢欢 ;
单广荣 .
西北民族大学学报(自然科学版), 2010, 31 (03) :49-52
[5]   命名实体识别研究进展综述 [J].
孙镇 ;
王惠临 .
现代图书情报技术, 2010, (06) :42-47
[6]   藏文自动分词系统中紧缩词的识别 [J].
才智杰 .
中文信息学报, 2009, (01) :35-37+43
[7]   基于单字提示特征的中文命名实体识别快速算法 [J].
冯元勇 ;
孙乐 ;
李文波 ;
张大鲲 .
中文信息学报, 2008, (01) :104-110
[8]  
藏族人名汉译名识别研究[J]. 罗智勇,宋柔,朱小杰.情报学报. 2009 (03)
[9]  
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007
[10]  
实用藏文文法[M]. 四川民族出版社 , 格桑居冕著, 1987