共 5 条
一种维吾尔语句子相似度算法的研究
被引:10
作者:
田生伟
[1
]
吐尔根依布拉音
[1
]
禹龙
[2
]
买合木提木合买提
[1
]
艾山吾买尔
[1
]
机构:
[1] 新疆大学信息科学与工程学院
[2] 新疆大学网络中心
来源:
关键词:
机器翻译;
基于实例机器翻译;
维吾尔语句子相似度;
D O I:
暂无
中图分类号:
TP391.2 [翻译机];
学科分类号:
081203 ;
0835 ;
摘要:
基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。
引用
收藏
页码:144 / 146
页数:3
相关论文