基于格助词和接续特征的藏文自动分词方案

被引:50
作者
陈玉忠
李保利
俞士汶
兰措吉
机构
[1] 北京大学计算语言学研究所
[2] 青海师范大学
关键词
格助词; 接续特征; 藏文分词;
D O I
10.16499/j.cnki.1003-5397.2003.01.011
中图分类号
H214 [藏语];
学科分类号
摘要
本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格助词、接续特征、字性知识库以及词典支持下 ,进行逐级定位的确定性分词。初步测试表明 :这一方案在发现和消除切分歧义、解决未登录词问题 ,进而在提高藏文分词精度方面具有很高的实用价值。
引用
收藏
页码:75 / 82
页数:8
相关论文
共 6 条
[1]  
计算语言学的应用研究与基础研究.[A].俞士汶;.中国中文信息学会二十周年学术会议.2001,
[2]   现代汉语自动分词评测技术研究 [J].
刘开瑛 .
语言文字应用, 1997, (01)
[3]   中文姓名的自动辨识 [J].
孙茂松,黄昌宁,高海燕,方捷 .
中文信息学报, 1995, (02) :16-27
[4]   书面汉语自动分词专家系统设计原理 [J].
何克抗 ;
徐辉 ;
孙波 .
中文信息学报, 1991, (02) :1-14+28
[5]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,
[6]  
新编藏文字典.[M].《新编藏文字典》编委会; 编著.青海民族出版社.1979,