融合音节特征的最大熵藏文词性标注研究

被引:14
作者
于洪志 [1 ]
李亚超 [1 ]
汪昆 [2 ]
冷本扎西 [1 ]
机构
[1] 西北民族大学
关键词
藏文; 词性标注; 最大熵; 形态特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型。实验结果表明,最大熵模型能够较好的处理藏文词性标注问题,音节特征可以显著提高藏文词性标注的效果,与基准系统相比使错误率降低了6.4%。
引用
收藏
页码:160 / 165
页数:6
相关论文
共 7 条
  • [1] 融合形态特征的最大熵蒙古文词性标注模型
    张贯虹
    斯劳格劳
    乌达巴拉
    [J]. 计算机研究与发展, 2011, 48 (12) : 2385 - 2390
  • [2] 藏文信息处理技术的研究现状与展望
    陈玉忠
    俞士汶
    [J]. 中国藏学, 2003, (04) : 97 - 107
  • [3] 汉藏语形态变体的分化
    宋金兰
    [J]. 民族语文, 2002, (01) : 29 - 33
  • [4] 藏语动词屈折形态的结构及其演变
    瞿霭堂
    [J]. 民族语文, 1985, (01) : 1 - 15
  • [5] 藏文词性自动标注系统的研究与实现[D]. 羊毛卓么.西藏大学 2012
  • [6] 基于HMM的藏语语料库词性自动标注研究[D]. 苏俊峰.西北民族大学 2010
  • [7] 中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000