维吾尔语词法中音变现象的自动还原模型

被引:13
作者
麦热哈巴艾力 [1 ,2 ]
姜文斌 [2 ]
吐尔根依布拉音 [1 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 中国科学院计算技术研究所
关键词
维吾尔语; 词法分析; 维吾尔语变音现象;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文针对维吾尔语的音变现象,提出了一种自动还原模型。与以往方法不同的是,此模型中我们把音变现象泛化,先假设维吾尔语中所有语音都有音变现象,从而将还原问题转化为类似于词性标注问题,再利用标注的方法解决了还原操作。在新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上做了实验,还原模块作为维吾尔语词法分析器的一部分,把词法分析器功能的F值从84.1%提高到了91.4%,同时维吾尔语中词缀数目最多、变形情况最复杂的动词词干的还原正确率也达到了88.6%,实际应用中完全可以被接受。
引用
收藏
页码:91 / 96
页数:6
相关论文
共 9 条
[1]
论维吾尔语SUBS+NP结构的形式化描述 [J].
阿孜古丽夏力甫 .
中文信息学报, 2011, 25 (02) :117-121
[2]
维吾尔语名词构形词缀有限状态自动机的构造 [J].
早克热·卡德尔 ;
艾山·吾买尔 ;
吐尔根·依布拉音 ;
艾斯卡尔·艾木都拉 .
中文信息学报, 2009, (06) :116-121
[3]
EBMT中高效的维吾尔语单词散列表构造算法 [J].
田生伟 ;
吐尔根依布拉音 ;
禹龙 .
中文信息学报, 2009, (04) :124-128
[4]
基于词法分析的维吾尔语元音弱化算法研究 [J].
米热古丽·艾力 ;
米吉提·阿不力米提 ;
艾斯卡尔·艾木都拉 .
中文信息学报, 2008, (04) :43-47
[5]
基于最小编辑距离的维语词语检错与纠错研究 [J].
玛依热·依布拉音 ;
米吉提·阿不里米提 ;
艾斯卡尔·艾木都拉 .
中文信息学报, 2008, (03) :110-114
[6]
维吾尔语动词附加语素的复杂特征研究 [J].
阿孜古丽·夏力甫 .
中文信息学报, 2008, (03) :105-109
[7]
面向自然语言信息处理的维吾尔语名词形态分析研究 [J].
阿依克孜卡德尔 ;
开沙尔卡德尔 ;
吐尔根依布拉音 .
中文信息学报, 2006, (03) :43-48+98
[8]
维吾尔语词切分方法初探 [J].
古丽拉·阿东别克 ;
米吉提·阿布力米提 .
中文信息学报, 2004, (06) :61-65
[9]
电脑处理维吾尔语语音和谐律的可能性 [J].
力提甫·托乎提 .
中央民族大学学报, 2004, (05) :108-113