基于知网与词林的词语语义相似度计算

被引:157
作者
朱新华
马润聪
孙柳
陈宏朝
机构
[1] 广西师范大学计算机科学与信息工程学院
关键词
语义相似度; 知网; 同义词词林; 语义距离;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文提出了一种综合知网与同义词词林的词语语义相似度计算方法。知网部分根据义原层次结构的特征,采用了顶部平缓而底部陡峭的曲线单调递减的边权重策略,改进了现有的义原相似度算法;词林部分采用以词语距离为主要因素、分支节点数和分支间隔为微调节参数的方法,改进了现有的词林词语相似度算法。然后再根据词语的分布情况,采用综合考虑知网与同义词林的动态加权策略计算出最终的词语语义相似度。该方法充分利用了词语在知网与词林中的语义信息,极大地扩充了可计算词语的范围,同时也提高了词语相似度计算的准确率。
引用
收藏
页码:29 / 36
页数:8
相关论文
共 11 条
[1]
《同义词词林》在中文实体关系抽取中的作用 [J].
刘丹丹 ;
彭成 ;
钱龙华 ;
周国栋 .
中文信息学报, 2014, 28 (02) :91-99
[2]
改进的基于《知网》的词汇语义相似度计算 [J].
朱征宇 ;
孙俊华 .
计算机应用, 2013, 33 (08) :2276-2279+2288
[3]
基于词典的名词性隐喻识别 [J].
贾玉祥 ;
俞士汶 .
中文信息学报, 2011, 25 (02) :99-104
[4]
基于同义词词林的词语相似度计算方法 [J].
田久乐 ;
赵蔚 .
吉林大学学报(信息科学版), 2010, 28 (06) :602-608
[5]
基于知网的词汇语义相似度计算方法研究 [J].
葛斌 ;
李芳芳 ;
郭丝路 ;
汤大权 .
计算机应用研究, 2010, 27 (09) :3329-3333
[6]
一种改进的基于《知网》的词语语义相似度计算 [J].
江敏 ;
肖诗斌 ;
王弘蔚 ;
施水才 .
中文信息学报, 2008, (05) :84-89
[7]
知网与同义词词林的信息融合研究 [J].
梅立军 ;
周强 ;
臧路 ;
陈祖舜 .
中文信息学报, 2005, (01) :63-70
[8]
同义词词林.[M].梅家驹等编;.上海辞书出版社.1996,
[9]
文本语义相似度计算方法研究 [D]. 
刘宏哲 .
北京交通大学,
2012
[10]
Ontology-based approach for measuring semantic similarity.[J].Mohamed Ali Hadj Taieb;Mohamed Ben Aouicha;Abdelmajid Ben Hamadou.Engineering Applications of Artificial Intelligence.2014,