维吾尔语词切分方法初探

被引:42
作者
古丽拉·阿东别克
米吉提·阿布力米提
机构
[1] 新疆大学信息科学与工程学院
关键词
人工智能; 自然语言处理; 维吾尔语; 词干; 词附加成分; 切分;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
维语词的词干 -词附加成分切分、音节切分的规律对维吾尔语自然语言处理方面提供更多方便。本文提出了以“词 =词根 +附加成分”结构。维语附加成分种类繁多 ,连接形式各式各样 ,在句子中起着非常重要的作用 ,同时有相当的规律性。本文提出了维语中可能出现的基本语音规律的处理方法 ,如 :语音同化、音节切分、语音和谐规律处理。本文对维文词的词法和语音法结构进行了归纳 ,提出了维语词切分的一些规律和实现方法。以新疆高校学报为语料来测试 ,对规则词准确率达到 95 %。
引用
收藏
页码:61 / 65
页数:5
相关论文
共 3 条
[1]   在多文种环境下的维吾尔语文字校对系统的开发研究 [J].
米吉提·阿布力米提 ;
库尔班·吾布力 .
系统工程理论与实践, 2003, (05) :117-124+144
[2]   高频最大交集型歧义切分字段在汉语自动分词中的作用 [J].
孙茂松 ;
左正平 ;
邹嘉彦 .
中文信息学报, 1999, (01) :28-35
[3]   汉语自动分词方法 [J].
殷建平 .
计算机工程与科学, 1998, (03) :62-68