基于语义理解的文本相似度算法

被引:77
作者
金博
史彦军
滕弘飞
机构
[1] 大连理工大学机械工程学院
[2] 大连理工大学机械工程学院 辽宁大连 大连理工大学计算机科学与工程系辽宁大连 
[3] 辽宁大连 大连理工大学计算机科学与工程系辽宁大连 
[4] 辽宁大连 
关键词
知网; 语义; 文本相似度; 复制检测; 信息检索;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.
引用
收藏
页码:291 / 297
页数:7
相关论文
共 4 条
[1]   基于语义计算的语句相关度研究 [J].
李素建 .
计算机工程与应用, 2002, (07) :75-76+83
[2]  
面向双语句对检索的汉语句子相似度计算[A]. 车万翔,刘挺,秦兵,李生.语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C]. 2003
[3]  
实用汉语语义学[M]. 学林出版社 , 陆善采著, 1993
[4]  
系统功能语法概论[M]. 湖南教育出版社 , 胡壮麟等编著, 1989