改进的HMM应用于哈萨克语词性标注

被引:7
作者
侯呈风
古丽拉·阿东别克
机构
[1] 新疆大学信息科学与工程学院
关键词
隐马尔科夫模型; 哈萨克语; 词性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础。在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑以及未登录词的处理方法,使之更好地体现词语的上下文依赖关系。利用基于统计的方法对哈萨克语熟语料进行训练,然后用Viterbi算法实现词性标注。实验结果表明利用改进的HMM进行词性标注的效果比传统的HMM好。
引用
收藏
页码:147 / 149
页数:3
相关论文
共 5 条