基于词汇语义计算的文本相似度研究

被引:24
作者
余刚
裴仰军
朱征宇
陈华月
机构
[1] 重庆大学计算机学院
关键词
《知网》; 相似度计算; 义原; 匹配; 向量空间模型;
D O I
10.16208/j.issn1000-7024.2006.02.020
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本所蕴涵概念的目的,并用实验对该方法的有效性进行了验证,提出了今后的改进方向。
引用
收藏
页码:241 / 244
页数:4
相关论文
共 4 条
[1]  
知识科学与计算科学.[M].陆汝钤主编;.清华大学出版社.2003,
[2]  
知识发现.[M].史忠植著;.清华大学出版社.2002,
[3]   基于语义计算的语句相关度研究 [J].
李素建 .
计算机工程与应用, 2002, (07) :75-76+83
[4]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26