采用CRF模型的哈萨克语信息技术术语自动抽取技术研究

被引:3
作者
木合亚提尼亚孜别克 [1 ,2 ]
古力沙吾利塔里甫 [3 ]
达吾勒阿布都哈依尔 [1 ,2 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆大学新疆多语种信息技术实验室
[3] 新疆医科大学中医学院
关键词
哈萨克语; 信息技术; 术语抽取; 条件随机场;
D O I
10.16783/j.cnki.nwnuz.2016.01.012
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
研究哈萨克语信息技术术语自动识别方法.采用基于条件随机场(CRF)的方法,针对哈萨克语信息技术术语的组成形式、定界规则等术语自动识别标注问题,结合哈萨克语本身词性、词边界、术语类别标注的特征,分析不同特征组合对术语识别的影响,并探讨最有效的组合.结果表明,CRF模型正确识别率为83.08%,召回率为80.13%,F值为80.57%.
引用
收藏
页码:53 / 56
页数:4
相关论文
共 8 条
[1]   基于条件随机场的汽车领域术语抽取 [J].
李丽双 ;
党延忠 ;
张婧 ;
李丹 .
大连理工大学学报, 2013, 53 (02) :267-272
[2]   采用CRF技术的军事情报术语自动抽取研究 [J].
贾美英 ;
杨炳儒 ;
郑德权 ;
杨靖 .
计算机工程与应用 , 2009, (32) :126-129
[3]   基于统计和规则相结合的科技术语自动抽取研究 [J].
刘豹 ;
张桂平 ;
蔡东风 .
计算机工程与应用 , 2008, (23) :147-150
[4]   基于互信息的中文术语抽取系统 [J].
张锋 ;
许云 ;
侯艳 ;
樊孝忠 .
计算机应用研究, 2005, (05) :72-73+77
[5]  
术语相似度计算方法研究.[M].徐健; 著.中山大学出版社.2012,
[6]  
汉哈英俄信息与计算机技术名词术语词典.[M].哈那提; 赛力克; 编.新疆科学技术出版社.2010,
[7]  
条件随机场在蒙古语词切分中的应用.[D].赵伟.内蒙古大学.2009, 04
[8]  
基于条件随机场的中文命名实体识别.[D].向晓雯.厦门大学.2006, 01