基于领域本体的文本相似度算法

被引:7
作者
王晋 [1 ]
孙涌 [1 ,2 ]
王璁玮 [1 ]
机构
[1] 苏州大学计算机科学与技术学院
[2] 江苏省计算机信息处理技术重点实验室
关键词
领域本体; 文本相似度; 语义距离;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本相似度计算在专利信息分析系统中有着广泛的应用前景。传统的基于向量空间模型的文本相似度计算方法,一方面未能很好地考虑上下文信息对词语语义的约束,导致不能对不同语境中词语的语义进行有效区分;另一方面使用词典作为计算相似度的依据具有领域相关性,在特定领域未能给出有效的语义理解。提出一种使用领域本体作为文本相似度计算基础的方法,该方法中使用语义消歧来解决上下文对于词语语义的影响;使用领域本体概念意义相同关系来计算文本相似度。实验结果显示本方法的准确度相对于现有典型的相似度计算方法有所提高。
引用
收藏
页码:13 / 17+25 +25
页数:6
相关论文
共 2 条
[1]   基于最大熵模型的本体概念获取方法 [J].
韦小丽 ;
孙涌 ;
张书奎 ;
苗艳军 .
计算机工程, 2009, 35 (24) :114-116+120
[2]   基于语义计算的语句相关度研究 [J].
李素建 .
计算机工程与应用, 2002, (07) :75-76+83