基于路径与深度的同义词词林词语相似度计算

被引:26
作者
陈宏朝
李飞
朱新华
马润聪
机构
[1] 广西师范大学多源信息挖掘与安全重点实验室
关键词
同义词词林; 路径; 深度; 分支间距; 最近公共父结点;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
该文提出了一种基于路径与深度的同义词词林词语语义相似度计算方法。该方法通过两个词语义项之间的最短路径以及它们的最近公共父结点在层次树中的深度计算出两个词语义项的相似度。在处理两个词语义项的最短路径与其最近公共父结点的深度时,为提高路径与深度计算的合理性,为分类树中不同层之间的边赋予不同的权值,同时通过两个义项在其最近公共父结点中的分支间距动态调节词语义项间的最短路径,从而平衡两个词语的相似度。该方法修正了目前相关算法只能得出几个固定的相似度值,所有最近公共父结点处于同一层次的义项对之间的相似度都相同的不合理现象,使词语语义相似度的计算结果更为合理。实验表明,该方法对MC30词对的相似度计算值与人工判定值相比,取得了0.856的皮尔逊相关系数,该结果高于目前大多数词语相似度算法与MC30的相关度。
引用
收藏
页码:80 / 88
页数:9
相关论文
共 14 条
[1]   《同义词词林》在中文实体关系抽取中的作用 [J].
刘丹丹 ;
彭成 ;
钱龙华 ;
周国栋 .
中文信息学报, 2014, 28 (02) :91-99
[2]   基于同义词词林的词语相似度计算方法 [J].
田久乐 ;
赵蔚 .
吉林大学学报(信息科学版), 2010, 28 (06) :602-608
[3]   基于语义树的中文词语相似度计算与分析 [J].
张亮 ;
尹存燕 ;
陈家骏 .
中文信息学报, 2010, (06) :23-30
[4]   基于知网的词汇语义相似度计算方法研究 [J].
葛斌 ;
李芳芳 ;
郭丝路 ;
汤大权 .
计算机应用研究, 2010, 27 (09) :3329-3333
[5]   一种改进的基于《知网》的词语语义相似度计算 [J].
江敏 ;
肖诗斌 ;
王弘蔚 ;
施水才 .
中文信息学报, 2008, (05) :84-89
[6]   知网与同义词词林的信息融合研究 [J].
梅立军 ;
周强 ;
臧路 ;
陈祖舜 .
中文信息学报, 2005, (01) :63-70
[7]   中文概念词典的结构 [J].
于江生 ;
俞士汶 .
中文信息学报, 2002, (04) :12-20+44
[8]   语义关系的表达和知识系统的建造 [J].
董振东 .
语言文字应用, 1998, (03) :79-85
[9]  
基于同义词词林的评分在中医案例自测系统中的应用[D]. 耿端.西北大学. 2013
[10]  
同义词词林[M]. 上海辞书出版社 , 梅家驹, 1983