融合形态特征的最大熵蒙古文词性标注模型

被引:10
作者
张贯虹 [1 ]
斯劳格劳 [2 ]
乌达巴拉 [3 ]
机构
[1] 合肥学院计算机科学与技术系网络与智能信息处理重点实验室
[2] 内蒙古大学蒙古学学院
[3] 中国科学院合肥物质科学研究院
关键词
形态特征; 最大熵模型; 蒙古文; 词性标注; 参数估计;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文词性标注模型.首先,根据蒙古文构词特点及统计分析结果,定义并选取特征模板,利用训练语料提取了大量的候选特征集合,针对错误或者无效的特征通过设置一些规则筛选特征.然后,训练最大熵概率模型参数.实验结果表明,融合蒙古文形态特征的最大熵模型可以较好地标注蒙古文.
引用
收藏
页码:2385 / 2390
页数:6
相关论文
共 3 条
[1]   融合聚类触发对特征的最大熵词性标注模型 [J].
赵岩 ;
王晓龙 ;
刘秉权 ;
关毅 .
计算机研究与发展, 2006, (02) :268-274
[2]  
基于混合策略的蒙—英机器翻译系统的研究[D]. 乌达巴拉.内蒙古大学. 2007
[3]   Persian POS tagging using probabilistic morphological analysis [J].
Fadaei, Hakimeh ;
Shamsfard, Mehrnoush .
INTERNATIONAL JOURNAL OF COMPUTER APPLICATIONS IN TECHNOLOGY, 2010, 38 (04) :264-273