基于Word2vec的句子语义相似度计算研究

被引:56
作者
李晓 [1 ]
解辉 [2 ]
李立杰 [3 ]
机构
[1] 安阳师范学院计算机与信息工程学院
[2] 清华大学计算机科学与技术系
[3] 北京理工大学软件学院
关键词
句子相似度; word2vec; 词向量; 语义; 句法结构;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
word2vec利用深度学习的思想,可以从大规模的文本数据中自动学习数据的本质信息。因此,借助哈尔滨工业大学的LTP平台,设计利用word2vec模型将对句子的处理简化为向量空间中的向量运算,采用向量空间上的相似度表示句子语义上的相似度。此外,将句子的结构信息添加到句子相似度计算中,并就特殊句式对算法进行了改进,同时考虑到了词汇之间的句法关系。实验结果表明,该方法更准确地揭示了句子之间的语义关系,句法结构的提取和算法的改进解决了复杂句式的相似度计算问题,提高了相似度计算的准确率。
引用
收藏
页码:256 / 260
页数:5
相关论文
共 10 条
[1]   基于FCA和Word2vec的异构资源本体构建研究 [J].
李端明 ;
韦炼 .
情报科学 , 2017, (03) :69-75
[2]   面向短文本的情感折射模型 [J].
张乐 ;
闫强 ;
吕学强 .
情报学报, 2017, (02) :180-189
[3]   面向迁移学习的文本特征对齐算法 [J].
魏晓聪 ;
林鸿飞 .
计算机工程, 2017, 43 (02) :215-219+226
[4]   基于word2vec的互联网商品评论情感倾向研究 [J].
黄仁 ;
张卫 .
计算机科学, 2016, 43(S1) (S1) :387-389
[5]   基于word2vec的大中华区词对齐库的构建 [J].
王明文 ;
徐雄飞 ;
徐凡 ;
李茂西 .
中文信息学报, 2015, (05) :76-83
[6]   一种基于知网的句子相似度计算方法 [J].
程传鹏 ;
吴志刚 .
计算机工程与科学, 2012, 34 (02) :172-175
[7]  
基于句子的文本表示及中文文本分类研究[J]. 何维,王宇.情报学报. 2009 (06)
[8]  
SemPathFinder: Semantic path analysis for discovering publicly unknown knowledge[J] . Min Song,Go Eun Heo,Ying Ding.Journal of Informetrics . 2015 (4)
[9]   Chinese comments sentiment classification based on word2vec and SVMperf [J].
Zhang, Dongwen ;
Xu, Hua ;
Su, Zengcai ;
Xu, Yunfeng .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (04) :1857-1863
[10]   Natural language scripting within conversational agent design [J].
O'Shea, Karen .
APPLIED INTELLIGENCE, 2014, 40 (01) :189-197