基于最小编辑距离的维语词语检错与纠错研究

被引:27
作者
玛依热·依布拉音
米吉提·阿不里米提
艾斯卡尔·艾木都拉
机构
[1] 新疆大学信息科学与工程学院
关键词
计算机应用; 中文信息处理; 维语尔语; 词法分析; 纠错; 最小编辑距离;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
拼写错误的发现和候选词选取是文本分析中的一个重要的技术问题。本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错误类型,详细分析了解决方法,利用最小编辑距离(minimume ditdistance)算法实现了维吾尔语文本拼写错误分析中的查错和纠错功能,并以此为基础,结合维吾尔语构词规则,进一步提高了建议候选词的准确率和速度。该算法已被成功地应用到了维吾尔语文字自动校对和多文种文本检索等领域中。在以新疆高校学报为语料的测试中,词语查纠率达到85%以上。
引用
收藏
页码:110 / 114
页数:5
相关论文
共 8 条
[1]
维吾尔文校对中常见错误分析 [J].
古丽拉·阿东别克 ;
艾尔肯·伊米尔 .
计算机工程与应用, 2005, (27) :181-183
[2]
维吾尔语词切分方法初探 [J].
古丽拉·阿东别克 ;
米吉提·阿布力米提 .
中文信息学报, 2004, (06) :61-65
[3]
在多文种环境下的维吾尔语文字校对系统的开发研究 [J].
米吉提·阿布力米提 ;
库尔班·吾布力 .
系统工程理论与实践, 2003, (05) :117-124+144
[4]
中文文本自动校对技术现状及展望 [J].
张仰森 ;
丁冰青 .
中文信息学报, 1998, (03)
[5]
自然语言处理综论[M] (美)DanielJurafsky;(美)JamesH.Martin著;冯志伟;孙乐译; 电子工业出版社 2005,
[6]
统计自然语言处理基础[M] (美)ChristopherD.Manning;(德)HinrichSchutze著;苑春法等译; 电子工业出版社 2005,
[7]
从短语结构到最简方案[M] 力提甫·托乎提著; 中央民族大学出版社 2004,
[8]
计算语言学概论[M] 俞士汶主编; 商务印书馆 2003,