一种维吾尔语句子相似度算法的研究

被引:10
作者
田生伟 [1 ]
吐尔根依布拉音 [1 ]
禹龙 [2 ]
买合木提木合买提 [1 ]
艾山吾买尔 [1 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆大学网络中心
关键词
机器翻译; 基于实例机器翻译; 维吾尔语句子相似度;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
081203 ; 0835 ;
摘要
基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。
引用
收藏
页码:144 / 146
页数:3
相关论文
共 5 条
[1]   语料库语言学与翻译研究 [J].
刘康龙 ;
穆雷 .
中国翻译, 2006, 27 (01) :59-64
[2]   句子相似模型和最相似句子查找算法 [J].
吕学强 ;
任飞亮 ;
黄志丹 ;
姚天顺 ;
不详 .
东北大学学报 , 2003, (06) :531-534
[3]   一种文本相似度及其在语音识别中的应用 [J].
李红莲 ;
何伟 ;
袁保宗 .
中文信息学报, 2003, (01) :60-64
[4]   基于实例的汉英机器翻译系统研究与实现 [J].
王长胜 ;
刘群 ;
不详 .
计算机工程与应用 , 2002, (08) :126-127+135
[5]   基于语义计算的语句相关度研究 [J].
李素建 .
计算机工程与应用, 2002, (07) :75-76+83