基于知网的词汇语义相似度计算方法研究

被引:66
作者
葛斌 [1 ]
李芳芳 [1 ]
郭丝路 [2 ]
汤大权 [1 ]
机构
[1] 国防科学技术大学CISR技术国防科技重点实验室
[2] 湖南省电力勘测设计院
基金
湖南省自然科学基金;
关键词
知网; 描述语言结构; 词汇相似度; 补充义原;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
利用知网的义原层次树,考虑树的深度、密度等因素对义原节点权重的影响,得到义原相似度。通过分析义项的描述语言结构,将关系义原和关系符号描述结构进行加权合并,综合考虑主要特征、次要特征、关系特征计算义项相似度,减少补充义原作为次要特征中的基本义原所带来的误差,在此基础上提出一种改进的词汇相似度计算方法。实验证明,该方法呈现向两端扩散的现象,能够更精确地区分词汇间的细微语义差别,计算结果更趋于合理。
引用
收藏
页码:3329 / 3333
页数:5
相关论文
共 6 条
[1]   基于知识图的汉语词汇语义相似度计算 [J].
张瑞霞 ;
朱贵良 ;
杨国增 .
中文信息学报, 2009, (03) :116-120
[2]   一种改进的基于《知网》的词语语义相似度计算 [J].
江敏 ;
肖诗斌 ;
王弘蔚 ;
施水才 .
中文信息学报, 2008, (05) :84-89
[3]   中文本体映射研究与实现 [J].
李佳 ;
祝铭 ;
刘辰 ;
杨正球 .
中文信息学报, 2007, (04) :27-33
[4]   汉语词语语义相似度计算研究 [J].
夏天 .
计算机工程, 2007, (06) :191-194
[5]  
汉英双语语料库自动对齐研究[D]. 王斌.中国科学院研究生院(计算技术研究所) 1999
[6]  
Information retrieval based on conceptual distance in IS-A hierarchies. Lee J H, Kim M H, Lee Y J. Journal of Documentation . 1993