一种基于本体的句子相似度计算方法

被引:36
作者
刘宏哲
机构
[1] 北京联合大学北京市信息服务工程重点实验室
关键词
句子相似度计算; 本体; WordNet;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
提出了一种基于树结构本体的句子相似度计算方法。利用本体概念与句子中关键词之间建立的语义索引,构建句子与本体间的直接和间接语义联系,据此提取描述句子的语义向量,从而计算句子间的语义相似度。应用微软研究院的意译语料库(MSRP)对本方法进行了验证,结果表明:与相关的计算方法相比,本方法在不完备附加信息应用前提下获得了较好的准确率和召回率。
引用
收藏
页码:251 / 256
页数:6
相关论文
共 2 条
[1]
Semantic text similarity using corpus-based word similarity and string similarity [J].
Islam, Aminul ;
Inkpen, Diana .
ACM Transactions on Knowledge Discovery from Data, 2008, 2 (02)
[2]
An introduction to latent semantic analysis [J].
Landauer, TK ;
Foltz, PW ;
Laham, D .
DISCOURSE PROCESSES, 1998, 25 (2-3) :259-284