句子相似模型和最相似句子查找算法

被引:64
作者
吕学强
任飞亮
黄志丹
姚天顺
不详
机构
[1] 东北大学信息科学与工程学院
[2] 沈阳师范大学计算中心
[3] 东北大学信息科学与工程学院 辽宁沈阳 
[4] 辽宁沈阳 
[5] 辽宁沈阳 
[6] 辽宁沈阳 
关键词
自然语言处理; 基于实例; 机器翻译; 句子相似度; 倒排索引; 语料库;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
摘要
提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法·实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小·
引用
收藏
页码:531 / 534
页数:4
相关论文
共 4 条
[1]   IHSMTS中实例模式获取机制的设计与实现 [J].
黄河燕 ;
陈肇雄 ;
胡曾剑 .
计算机研究与发展, 2002, (05) :588-592
[2]   基于实例的汉英机器翻译系统研究与实现 [J].
王长胜 ;
刘群 .
计算机工程与应用, 2002, (08) :126-127+135
[3]   一种规则描述语言NPRDL语言 [J].
朱靖波 ;
王宝库 ;
姚天顺 .
东北大学学报, 1996, (06) :75-79
[4]  
Towards a Dynamic Linkage of Example-based and Rule-based Machine Translation[J] . Michael Carl,Cathrine Pease,Leonid L. Iomdin,Oliver Streiter.Machine Translation . 2000 (3)